今天小編分享的互聯網經驗:動察:探索Figure AI的Helix模型:讓機器人更聰明、更高效,歡迎閲讀。
具身機器人的發展,技術上來説已經進入到百家争鳴的新階段,各個廠商都在試圖用更好的技術來驅動機器人。而如何讓機器人看起來更聰明,處理事情更加有效率,是要解決的一個難點。我們通過追蹤不同機器人廠商的技術前沿,可以感知具身機器人進化的脈搏。這次我們來認識下 Figure AI 的 Helix 人工智能模型,以及采用這個新技術的具身機器人 Figure 02,未來有望提升人類生產力。
老齡化衝擊下,人類社會需要機器人來提高生產力
談起,Figure AI,就不能不提起創始人兼首席執行官 Brett Adcock。他是一個連續創業者,他認為,人類正面臨前所未有的勞動力短缺。僅在美國就有超過 1000 萬個不安全或不受歡迎的工作崗位,人口老齡化只會讓企業擴大勞動力規模變得越來越困難。而在這個時期,多個國家和地區出現了人口老齡化,包括中國。
因此,本世紀勞動力供應增長将逐步停止。如果人類社會想要繼續增長,就需要提高生產力——這意味着更多的自動化。
Figure 的目标是:開發通用人形機器人,為人類帶來積極影響,為子孫後代創造更美好的生活。這些機器人可以滿足對不安全和不受歡迎的工作的需求,從事危險和重復性的體力勞動——最終讓我們過上更快樂、更有意義的生活。
值得慶幸的是,我們正處于人工智能和機器人革命的早期階段。這為大幅提高我們的生產和生活水平提供了獨特的機會。
随着自動化繼續大規模融入人類生活,我們可以預測,我們所熟知的以勞動力為基礎的經濟将發生轉變。能夠思考、學習、推理并與環境互動的機器人最終将能夠比人類更好地完成任務。
Figure AI 在具身機器人的硬體及成本上精打細算
那麼要如何構建功能齊全的具身機器人,執行類似人類的操作,并将人形機器人融入勞動力之中。這是一個三步走的路徑,只有把這三個路徑完成,才能形成生產力。
而在具身機器人的硬體方面,Figure AI 團隊已經推出了 2 款全電動機械人形機器人,具備雙手,而最新的產品是 Figure 02。與 Figure 01 不同,新品外觀看過去更拟人,五個手指更加靈巧多變。據介紹,迭代後的 Figure 手部具有 16 個自由度,能夠承受與人類相當的力量。Figure 02 配備了 6 個 RGB 攝像頭,用于感知物理世界,同時還有麥克風和揚聲器用來和人類進行互動。
Figure AI 目标是開發具有人類身體能力的硬體。正在根據運動範圍、有效載荷、扭矩、運輸成本和速度來衡量這一點,并将通過快速的開發周期不斷改進。同時,通過高產量生產降低單個機器人的部門成本,努力實現可持續的規模經濟。
Figure AI 在人工智能以及機器人神經網絡上取得突破
機器人要實現人類的一些動作,如果只是模仿,那不足以形成自主行為能力,這時候引入 AI 人工智能是很好的解決方案。Figure AI 的第一代產品,Figure 01 學會了搬箱子,能夠完成簡單的體力任務。随後,通過觀看人類示範視頻就學會了衝咖啡,還會自己糾正錯誤。緊接着,Figure 宣布同 OpenAI 籤署合作協定,為其人形機器人開發生成式 AI,但這只是第一個階段。
最大的突破來自于 Figure AI 自身,他們斷開和 OpenAI 的合作,推出了 Helix,這是一種通用的 " 視覺 - 語言 - 動作 " ( VLA ) 模型,它将感知、語言理解和學習控制統一起來,以克服機器人技術領網域的多項長期挑戰。
Helix 是個極大的突破,是第一款對整個人形上身(包括手腕、軀幹、頭部和各個手指)進行高速率連續控制的 VLA 模型。這就意味着可以實現多個機器人之間的協作,共同完成一項需要連續操作的任務。
另外,它有了一些自主學習決策的能力,配備了 Helix 的 Figure 02 機器人現在只需按照自然語言提示,就能拿起幾乎任何小型家居物品,包括數千種它們從未遇到過的物品。
這就需要賦予機器人思考的靈魂,Helix 使用一組神經網絡權重來學習所有行為(挑選和放置物品、使用抽屜和冰箱以及跨機器人互動),而無需任何針對特定任務的微調。并且是第一款完全在嵌入式低功耗 GPU 上運行的 VLA 模型,可立即進行商業部署,在未來的成本上也有一定優勢。
Figure AI 的機器人已經可以執行包裹分類和處理任務
将人形機器人引入勞動力隊伍是 Figure 使命的核心。而最新的 Figure AI 的機器人已經可以進行物流包裹處理和分類。這項任務需要人類級别的速度、精度和适應性,突破了從像素到動作的學習操作的界限。
這個能力是 Helix System 1 大模型迭代來的,其具有豐富的 3D 理解能力,可以實現更精确的深度感知運動。每個 Figure 機器人現在都可以自我校準,從而實現跨機器人無縫傳輸。使用簡單的測試時間加速技術,Helix 實現了比演示者更快的執行速度,同時保持了較高的成功率和靈活性。
在以往傳統的具身機器人模拟中,需要對物品進行描繪和界定。而物流包裹是變化的,由于環境永遠無法完全預測,因此系統必須能夠自我糾正。此外,它還需要跟蹤連續移動的傳送帶上大量包裹的動态流動并保持高吞吐量。Helix 視覺運動策略現在将兩個攝像頭的特征合并到多尺度立體網絡中,然後再進行标記,多尺度特征使系統能夠解釋精細細節以及更廣泛的上下文線索,共同促進視覺控制的可靠性。
最後,通過利用學習校準和視覺本體感受模塊,Figure AI 能夠将最初在單個機器人數據上訓練的相同策略應用于多個其他機器人,這就是協同工作的核心能力。也就是這個能力,使得其上流水線能夠發揮更大的生成效能。
Figure AI 的官方視頻展示了如何利用高質量的數據集,結合立體多尺度視覺、在線校準和測試時間加速等架構改進,在現實世界的物流分揀場景中實現比演示者更快的靈巧機器人操作——所有這些都是在使用相對适量的演示數據的情況下實現的。物流分揀線的機器人視頻已經發布,也就是説,Figure AI 在機器人轉化為勞動力上已經取得了成就。
Figure AI 不斷獲得融資,是對其技術路線的肯定
最新消息,Figure AI 正在洽談新一輪 15 億美元融資,公司估值高達 395 億美元,比上一輪高了 15 倍左右。預計将由 Align Ventures 和 Parkway Venture Capital 領投。
而在這之前,2024 年 3 月,Figure AI 宣布完成 6.75 億美元,估值 26 億美元,投資方包括微軟、OpenAI Startup Fund、Nvidia(英偉達)、亞馬遜工業創新基金、在科技界響當當的另一個人物傑夫 · 貝索斯(Jeff Bezos)、Parkway Venture Capital、英特爾投資、Align Ventures 和 ARK Invest,都是有份量的投資人。
Figure AI 創始人兼首席執行官 Brett Adcock 近期稱,Figure 已籤約第二位(目前還處在保密階段)商業客户,并有望出貨 100,000 個人形機器人。而實際上,它的第一個客户是寶馬公司,其具身機器人已經在寶馬工廠測試一些簡單的工作。
Figure AI 的融資如果能夠再度落實,那就意味着其技術路線受到行業肯定。不過全新的 Helix 模型驅動的機器人能力還處在早期階段,後面會進化到什麼程度,能不能批量商業化成會思考能決策自主進化的勞動力機器人,我們拭目以待。