今天小編分享的互聯網經驗:香港科技大學聯手微軟等機構,公布影像分割模型 Semantic-SAM,歡迎閱讀。
品玩 7 月 12 日訊,據 Arxiv 頁面顯示,來自香港科技大學、微軟研究院、IDEA 等多個機構的學者近日聯合發布論文,公布了一款影像分割模型 Semantic-SAM。
論文顯示,該模型具有兩個關鍵優勢:語義感知和粒度豐富性。為了實現語義感知,研究者們整合了三個粒度上的多個數據集,并引入了對象和部分的解耦分類。這使得 Semantic-SAM 能夠捕捉豐富的語義信息。對于多粒度能力,研究者在訓練過程中提出了一種多選擇學習方案,使每次點擊可以生成與多個标準掩膜相對應的多個級别的掩膜。
實驗結果和可視化展示表明,Semantic-SAM 成功實現了語義感知和粒度豐富性。