大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

比Meta「分割一切AI」更全能!港科大版影像分割AI來了:實現更強粒度和語義功能

2023-07-17 简体 HK SG TW

今天小編分享的科學經驗:比Meta「分割一切AI」更全能!港科大版影像分割AI來了:實現更強粒度和語義功能,歡迎閱讀。

比 Meta" 分割一切 " 的 SAM 更全能的影像分割 AI,來了!

模型名為Semantic-SAM,顧名思義,在完全復現 SAM 分割效果的基礎上,這個 AI 還具有兩大特點:

語義感知:模型能夠給分割出的實體提供語義标籤

粒度豐富:模型能夠分割從物體到部件的不同粒度級别的實體

用作者自己的話說:

Semantic-SAM,在多個粒度 ( granularity ) 上分割 ( segment ) 和識别 ( recognize ) 物體的通用影像分割模型。

據我們所知,我們的工作是在 SA-1B 數據集、通用分割數據集 ( COCO 等 ) 和部件分割數據集 ( PASCAL Part 等 ) 上聯合訓練模型的首次嘗試,并系統研究了在 SA-1B 上定義的互動分割任務 ( promptable segmentation ) 和其他分割任務 ( 例如,全景分割和部件分割 ) 上多任務聯合訓練的相互促進作用。

論文來自香港科技大學、微軟研究院、IDEA 研究院、香港大學、威斯康星大學麥迪遜分校和清華大學等研究部門。

具體詳情,一起來看 ~

論文地址:https://arxiv.org/abs/2307.04767

代碼地址:https://github.com/UX-Decoder/Semantic-SAM

在線 Demo 地址:上述代碼倉庫的首頁

( 以下為論文作者投稿 )

簡介

Semantic-SAM 可以完全復現 SAM 的分割效果并達到更好的粒度和語義功能,是一個強大的 vision foundation model。Semantic-SAM 支持廣泛的分割任務及其相關應用,包括:

Generic Segmentation 通用分割(全景 / 語義 / 實例分割)

Part Segmentation 細粒度分割

Interactive Segmentation with Multi-Granularity Semantics 具有多粒度語義的互動式分割

Multi-Granularity Image Editing 多粒度影像編輯

1.1 復現 SAM

SAM 是 Semantic-SAM 的子任務。我們開源了復現 SAM 效果的代碼,這是開源社區第一份基于 DETR 結構的 SAM 復現代碼。

1.2 超越 SAM

粒度豐富性 : Semantic-SAM 能夠產生用戶點擊所需的所有可能分割粒度(1-6)的高質量實體分割,從而實現更加可控和用戶友好的互動式分割。

語義感知性。Semantic-SAM 使用帶有語義标記的數據集和 SA-1B 數據集聯合訓練模型,以學習物體 ( object ) 級别和細粒度 ( part ) 級别的語義信息。

多功能。Semantic-SAM 實現了高質量的全景,語義,實例,細粒度分割和互動式分割,驗證了 SA-1B 和其他分割任務的相互促進作用。

只需單擊一下即可輸出多達 6 個粒度分割!與 SAM 相比,更可控地匹配用戶意圖,不用擔心滑鼠移動很久也找不到想要的分割了~

2. 模型介紹 2.1 模型結構

Semantic-SAM 的模型結構基于 Mask DINO 進行開發。Mask DINO 是基于 DETR 框架的統一檢測和分割的網絡,目前仍然是相同模型 size 下的 SOTA 模型。Semantic-SAM 的模型結構主要改進在 decoder 部分,同時支持通用分割和互動式分割。通用分割的實現與 Mask DINO 相同。互動式分割包括 point 和 box 兩種形式,其中 box 到 mask 不存在匹配的 ambiguity,實現方式與通用分割相同,而 point 到 mask 的匹配是 Semantic-SAM 的關鍵設計。

在 Semantic-SAM 中,用戶的 point 輸入被轉換成 6 個 prompt, 每個 prompt 包含一個可學習的 level embedding 進行區分。這 6 個 prompt 通過 decoder 產生 6 個不同粒度的分割結果,以及 object 和 part 類别。

2.2 訓練

為了學到物體級别 ( object ) 和部件級别 ( part ) 的語義,Semantic-SAM 同時從多個數據集中進行學習,如多粒度數據集 ( SA-1B ) ,物體級别數據集 ( 如 COCO ) ,以及部件級别數據集 ( 如 Pascal Part ) 。

為了從聯合數據集中學習語義感知性和粒度豐富性,我們引入以下兩種訓練方法:

解耦物體分類與部件分類的語義學習:為了學習到可泛化的物體和部件語義,我們采用解耦的物體分類和部件分類,以使得只有 object 标注的數據也可以學習到一些通用的 part 語義。例如,head 是在幾乎所有動物上都通用的 part,我們期望模型從有标注的 dog head,cat head,sheep head 等 head 中學習到可泛化的 lion,tiger,panda 等 head 的識别能力。

Many-to-Many 的多粒度學習:對于互動式分割中的 point 輸入,Semantic-SAM 利用 6 個 prompt 去輸出多粒度的分割結果,并用包含該點擊的所有标注分割來作為監督。這種從多個分割結果到多個分割标注的 Many-to-Many 的匹配和監督,使得模型能夠達到高質量的多粒度分割效果。

3. 實驗 3.1 SA-1B 與通用分割數據集的聯合訓練

我們發現,聯合訓練 SA-1B 和通用分割數據集可以提高通用分割性能,如對 COCO 分割和檢測效果有大幅提升。

在訓練 SA-1B 數據的過程中,我們也發現了利用少量 SA-1B 的數據即可得到很好的效果。

3.2 SA-1B 與細粒度分割數據集的聯合訓練

同樣的,聯合訓練 SA-1B 和細粒度分割數據集可以提高部件分割性能。

4. 可視化 4.1 Semantic-SAM 的 prompt 從大量數據中學到了固定模式的表征

Semantic-SAM 一共有 6 個可學習的 prompt。對于不同圖片的點擊,觀察每個 prompt 對應的分割結果,可以發現每個 prompt 的分割都會對應一個固定的粒度。這表明每個 prompt 學到了一個固定的語義級别,輸出更加可控。

4.2 Semantic-SAM 與 SAM, SA-1B Ground-truth 的比較

每行最左邊影像上的紅點是用戶點擊的位置, ( a ) ( b ) 分别是 Semantic-SAM 和 SAM 的分割輸出, ( c ) 是包含用戶點擊的 Groud-truth 分割。與 SAM 相比,Semantic-SAM 具有更好的分割質量和更豐富的粒度,方便用戶找到自己需要的分割粒度,可控性更好。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們