今天小編分享的互聯網經驗:國家隊出手,通用人形機器人打響第一槍,歡迎閱讀。
人形機器人距離下場幹活,又往前邁進了一步。
3 月 12 日,北京人形機器人創新中心對外發布了首個 " 一腦多能 "、" 一腦多機 " 的通用具身智能平台 " 慧思開物 "。通過該平台,這家公司試圖将人形機器人的通用化能力拆解成單個的技能模塊,通過組合這些技能模塊,讓通用人形機器人的開發門檻大幅降低,并且還能讓不同形态的機器人也能适配這些能力。
" 具身智能在‘智能化’方面仍處于初級階段,行業亟需一個具備多本體兼容性、多場景适應性和強大泛化能力的通用智能平台。為了替具身智能產業補上通用軟體系統這塊重要拼圖,創新中心研發了全球首個支持多本體多場景應用的通用具身智能平台‘慧思開物’。"
創新中心總經理熊友軍表示,在 " 慧思開物 " 的支持下,優必選在全球範圍内首次把群腦網絡(BrainNet)用于人形機器人執行整條產線的工業級任務。
AI 大模型 + 元技能庫,組建 " 大腦 " 與 " 小腦 "
具體而言," 慧思開物 " 由 AI 大模型驅動的任務規劃 " 大腦 " 以及數據驅動的端到端技能執行具身 " 小腦 " 構成。
其中," 大腦 " 具備自然互動、空間感知、意圖理解、分層規劃和錯誤反思等能力," 小腦 " 分為具身操作和具身運控兩個子平台:具身操作涵蓋元技能庫、泛化抓取、技能拆解和錯誤處理等功能,而具身運控負責實現全身控制、雙臂協作、穩定行走和移動導航等任務。
由具身 " 大腦 " 進行任務規劃,再調用具身 " 小腦 " 技能庫執行具體動作,并将執行反饋傳遞給具身 " 大腦 ",形成任務閉環。
基于高效協同的具身 " 大腦 " 與具身 " 小腦 " 架構," 慧思開物 " 可以精準解析自然語言互動指令,通過多模态信息融合與上下文理解,将復雜任務分解為可執行的子任務序列,并在任務執行過程中實時監測狀态,通過自适應糾錯機制和動态路徑規劃,确保任務的高效推進與準确完成。
同時," 慧思開物 " 内置多場景适配引擎,支持從工業制造到家庭服務等多種場景,結合高效的資源調度與并行計算能力,能夠精準滿足特定場景下的工作節拍與精度标準,為機器人在復雜場景的應用提供可靠的技術保障。
" 現在慧思開物的技能庫中已經具備了 30 多種技能,可以覆蓋大部分的任務類型。" 創新中心 CTO 唐劍表示,整個端側運動控制的輸出功率為 200 赫茲,可以讓機器人的整個運動非常平滑。
而在人形機器人的數據訓練方面,目前業界主流的訓練方式有兩種。其一,是讓機器人在仿真環境中訓練,然後将訓練結果遷移到真實環境中;其二,則是讓機器人直接在真實環境中訓練,根據真實環境的訓練過程進行 AI 的直接調教。
宇樹科技創始人曾向钛媒體表示,随着端到端的 AI 模型進一步完善,仿真數據對于人形機器人将不再重要。而在與創新中心的交流中,唐劍則向钛媒體表示,他們更傾向于虛實結合的數據訓練方式。
" 我們一貫堅持虛實結合的訓練,才能達到最好的效果。" 唐劍稱,在虛拟環境中能夠非常好地去泛化和随機化場景,比如改變環境光線、物體形狀、顏色等。而在實際場景中,這些多樣性并不容易實現。
根據創新中心提供的數據,當混合數據比例達到真機數據:仿真數據為 100:400 時,機器人的執行成功率接近 100%。
距離 " 下場幹活 ",越來越近
基于虛實結合的訓練模式和以技能庫為核心的運動執行方式," 慧思開物 " 此次也展示了工業分揀、積木搭建、桌面清理和物流打包四個場景的真機操作。通過語音互動、APP 直連等多種方式,用戶能夠與機器人自然互動,并通過模糊指令讓機器人完成操作任務。
在工業分揀任務中,通過 " 慧思開物 "APP 直連,UR-5e 機械臂能夠精準解析語音指令,将復雜的技術能力(如推理、規劃、技能調用)封裝為簡單易用的操作流程,并通過雙臂協同的方式完成分揀操作,顯著降低了用戶使用門檻。
同時,平台支持自定義模型和技能的快速添加,能夠靈活适配不同場景的應用需求,為工業自動化領網域提供便捷、高效的解決方案。
在積木搭建中," 慧思開物 " 通過大模型思維鏈能力,首次實現了復雜任務的智能化拆解與執行。基于随機搭建的積木樣例," 天工 " 利用視覺大模型(VLM)對樣例進行拆解,精确規劃每一層的搭建順序,準确拾取相應積木,并按次序完成了 3 層積木的毫米級精準搭建。
在桌面清理場景中,人形機器人 " 天工 " 展現了雙臂協作的高效性與動态環境下的自适應能力,流暢地整理桌面餐具,将垃圾收進錫紙盤并放入垃圾桶。整個過程中,機器人在多次任意随機的人為打斷和移位幹擾的情況下,仍能自主糾錯、重新規劃并完成任務。
在物流打包場景,基于 " 慧思開物 " 平台," 天工 PRO" 首次實現了全尺寸人形機器人物流打包全流程的自主作業。
通過上半身 29 個自由度的配合," 天工 PRO" 使用左右手分别拿起物品和掃碼槍,通過頭部相機确認物品條碼位置,雙手協同完成掃碼、裝箱、封箱及粘貼快遞标籤等一系列操作。
" 目前,創新中心正在将這些能力逐步實現商業化落地。" 唐劍稱,現在主要探索的方向為教育科研、健康養老、特種作業以及工業制造。(本文首發于钛媒體 APP,作者 | 饒翔宇 編輯 | 鍾毅)