大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

Zero-shot重建物理高斯資產,清華&光輪視覺大模型讓機器人理解物理屬性

2025-02-25 简体 HK SG TW

今天小編分享的科學經驗:Zero-shot重建物理高斯資產,清華&光輪視覺大模型讓機器人理解物理屬性,歡迎閱讀。

理解物體的物理屬性,對機器人執行操作十分重要,但是應該如何實現呢?

光輪智能與清華 AIR、同濟大學等機構聯合提出了一種基于 3D 高斯濺射的方法——

PUGS(Zero-shot Physical Understandingwith Gaussian Splatting)

無需訓練、零樣本,它就能夠從多視角影像中重建物體,并對各種指定的物理屬性進行密集重建。

該論文已被 ICRA 2025 接收。

在非結構化環境中,準确理解物體的物理屬性不僅能幫助機器人更好地規劃抓取策略,還能避免因錯誤估計導致的操作失敗(比如下手太重導致物體損壞)。

現有的方法如 NeRF2Physics 利用 NeRF 來對物體進行重建,并結合視覺語言模型(VLM)與大語言模型(LLM)進行物理屬性預測。

但是,此類方法存在預測結果碎片化、物理屬性不連續不合理的問題。

研究團隊通過 3D 高斯濺射作為重建表征,并引入區網域感知特征來增強區網域區分的能力。

在此基礎上,結合基于 VLM 的物理屬性預測和基于特征的屬性傳播,可以達到更好的物體重建和更加合理的物理屬性預測結果。

為了保持重建結果的幾何一致性,研究團隊還引入了幾何感知的正則化損失和稀疏損失,确保高斯分布與物體的實際空間形狀分布一致。

高斯濺射 + 視覺大模型,理解物理屬性

PUGS 框架分為三個階段——形狀與區網域感知的 3DGS 重建、基于視覺語言模型(VLM)的物理屬性預測,以及基于區網域特征的屬性傳播。

對于物體級别的物理屬性(例如質量),則還包含高斯體積積分模塊以得到整體的物理屬性結果。

PUGS 以物體的多視角影像作為輸入,同時允許給定需要預測的物體屬性(如密度、硬度系數、楊氏模量等),最終輸出則是物體的重建結果,其中包含了物體的 RGB 信息,以及任意位置的物理屬性。

形狀與區網域感知的 3DGS 重建

PUGS 首先使用 3DGS 來從多視角 RGB 影像中重建物體。

但是原始的 3DGS 重建通常會出現 Floater,這導致重建結果的細節表現不佳,并且在幾何的準确性上存在問題。

研究團隊參考現有方法,引入幾何感知的正則化損失和稀疏損失,損失項如下(如顯示不完整,請左右滑動):

其中,是影像中的像素集合,是歸一化到 0 到 1 的影像梯度;

是基于像素點的局部平面計算得到的法向量,是基于 PGSR 提出的無偏深度渲染計算得到的法向量,是每個高斯的不透明度。

這裡是幾何感知的正則化損失,是稀疏損失。

前者通過兩種不同方式來渲染法線圖,并鼓勵輸出結果盡可能一致,從而确保高斯分布與物體的實際空間形狀一致;

而後者則鼓勵每個高斯的不透明度靠近 0 或 1,減少中間結果的存在。

引入幾何感知的正則損失(Geometry-Aware Regularization Loss, GARL)後,可以有效緩解 Floater 問題,增強幾何的準确性。

此外,PUGS 還引入了區網域感知的特征對比損失,通過對比學習訓練高斯分布的特征,使其能夠區分物體的不同區網域。

在現實場景中,物體表面可能存在不同的材料,如金屬、木材、塑料等,而這些材料在物體上通常表現為不同的區網域。

對區網域的區分有助于提高物理屬性預測的準确性。

研究團隊首先向每個 Gaussian 上引入一個新的可學習特征,并使用 -blending 來渲染出不同視角下的特征圖,然後使用 SAM 對多視角影像進行分割,以區分物體的不同區網域。

之後,利用對比學習來訓練該特征。損失函數如下:

其中,表示兩個像素是否屬于同一個區網域,是兩個像素點在特征空間中的餘弦相似性。

直觀來說,如果兩個像素點屬于同一個區網域,那麼它們在特征空間中的餘弦相似性應該越大越好,反之則應該越小越好。

△幾何感知損失與形狀感知特征訓練的示意圖基于 VLM 的物理屬性預測

在重建階段完成後,PUGS 利用視覺語言模型(VLM)進行零樣本物理屬性預測。

NeRF2Physics 采用兩階段的方法來進行物理屬性預測。

它首先通過 VLM 來從物體的影像預測物體的文本描述,然後将該文本描述輸入給 LLM 來預測材質和物理屬性。

與 NeRF2Physics 不同,PUGS 直接使用 VLM 對多視角影像中的某一張進行材質和物理屬性預測,避免了影像到文本轉換過程中的信息丢失。

該階段 VLM 輸出的結果包括物體可能的材質,以及這些材質的物理屬性範圍等。

這些屬性在後續會通過 CLIP 特征傳播到重建的 3DGS 中。

基于區網域特征的屬性傳播

為了将預測的物理屬性傳播到重建結果中,PUGS 使用 CLIP 特征作為基礎進行映射,并使用區網域感知特征作為依據進行屬性傳播。

首先研究團隊從 3DGS 中随機采樣一些高斯點作為 source point,并計算這些 source point 投影到多視角影像上得到的 patch 對應的 CLIP 特征。

這些特征與上一階段得到的候選材質進行相似性的計算,以分配不同的材質到對應的 source point 上。計算方式如下:

其中,是 source point 的物理屬性值,是 source point 的 CLIP 特征與候選材質的 CLIP 特征之間的餘弦相似性,是一個溫度參數。

△基于形狀感知特征的物理屬性傳播

為了完成密集的物理屬性預測,研究團隊使用區網域特征作為依據進行屬性傳播。計算方式如下:

其中,和分别是高斯和的區網域感知特征。

基于區網域感知特征的屬性傳播方式使得物理屬性預測結果更加均勻和精确。

高斯體積積分

通過上面三個階段,PUGS 已經可以完成物體的重建以及密集的物理屬性預測,即在物體表面的每個點都能夠得到相應的物理屬性。

而對于物體級别的物理屬性(如質量),PUGS 提出了基于高斯體積積分的模塊來進行計算。

以物體質量的預測為例,通過上述階段,PUGS 可以得到每個 3D 高斯點對應的物理屬性,即密度值。

之後每個 3D 高斯被視為一個 3D 橢球體,通過其不透明度進行加權,同時結合預測的密度值進行累積計算,得到物體的初步體積預測。

這個初步體積預測結果是存在誤差的,因為 3DGS 重建結果通常只會對物體的表面進行建模,而物體内部表現出空洞。

為了進一步提高精度,PUGS 引入了 "pure volume" 概念,這代表一個物體忽略空洞區網域後的體積,一般會遠小于通常意義下物體的體積。

PUGS 通過提示 VLM 來獲取物體的 pure volume,并以此修正最終的預測結果。

預測準确性大幅提升

定性結果顯示,NeRF2Physics 的材質預測表現出碎片化等不合理的情況,PUGS 的預測結果則更加準确和合理。

在物體的抓取實驗中,PUGS 準确預測了一個棉布包裹的楊氏模量(0.5+GPa),使機械臂的夾持器能夠以合适的開口大小成功抓取物體。

相比之下,NeRF2Physics 錯誤地預測了該物體的楊氏模量(30+GPa),導致夾持器開口接近物體寬度,最終抓取失敗。

研究團隊還在 ABO-500 數據集上進行了物體質量估計的實驗,并與 NeRF2Physics 進行了對比,結果 PUGS 在多個指标上都表現更優。

此外,研究團隊還對上述 PUGS 的 Pipeline 中的不同模塊進行消融實驗,包括幾何感知的正則化損失、區網域感知的特征訓練以及基于高斯體積積分模塊,結果表明這些模塊都有助于提升定量結果。

其中不僅在 ABO-500 數據集上整體有所提升,并且在一些具有特殊特征的物體上提升更加明顯。

下表的 subset A 指的是 ABO-500 中一些具有較為精細結構的物體組成的子集,而 subset B 指的是那些具有多種區網域和材質的物體子集。

這表示幾何感知的正則化損失對具有精細結構的物體提升較大,而區網域感知模塊則對多種材質和區網域的區分更加有效。

總之,PUGS 不僅能夠準确重建物體的幾何形狀,還能保持物理屬性預測的材質一致性,這對于實際的機器人應用具有重要意義。

同時該重建結果也能夠作為一種攜帶相關物理屬性的重建資產,用于其他相關的下遊任務。

論文地址:

https://arxiv.org/pdf/2502.12231

項目主頁:

https://evernorif.github.io/PUGS/

GitHub:

https://github.com/EverNorif/PUGS

—  完  —

投稿請工作日發郵件到:

[email protected]

标題注明【投稿】,告訴我們:

你是誰,從哪來,投稿内容‍

附上論文 / 項目主頁鏈接,以及聯系方式哦

我們會(盡量)及時回復你

一鍵關注 點亮星标

科技前沿進展每日見

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們