今天小編分享的互聯網經驗:華為離職“天才少年”登上熱搜,智元稱“機器人公司不做大模型是沒有未來的”,歡迎閱讀。
曾是華為 " 天才少年 "、現智元聯合創始人 " 稚晖君 " 彭志輝(來源:央視網)
曾憑借華為 " 天才少年 " 計劃以 201 萬年薪加入、現任智元聯合創始人兼 CTO 的 " 稚晖君 " 彭志輝,日前在微博發布預告 " 下周智元機器人有好東西發布 "。
3 月 10 日上午,智元機器人正式發布首個通用具身基座模型——智元啟元大模型 GO-1(Genie Operator-1)。
該模型基于 Vision-Language-Latent-Action ( ViLLA ) 框架,由 VLM ( 多模态大模型 ) +MoE ( 混合專家 ) 組成,具有采訓推一體,小樣本快速泛化、" 一腦多形 " 的跨本體應用、持續進化、人類視頻學習等突出優勢,可以借助人類和多種機器人數據,賦予機器人革命性學習能力。
上述消息引發熱議。10 日上午,# 華為離職天才少年官宣刷屏 #、# 稚晖君或再掀機器人行業風暴 # 等多個詞條登上了微博熱搜。
3 月 10 日上午溝通會上,智元具身研究中心常務主任任廣輝對钛媒體 AGI 等表示,截至目前,智元機器人已經量產下線 1000 台機器人。他還透露,Go-1 基于通用數據訓練,擁有非常強的泛化能力,在零數據下可以泛化到一個新場景、新任務,而基于該模型可以部署到各行各業當中,整體成本會比較低。
任廣輝強調," 具身智能 " 會向通用化、開放化和智能化邁進,走向開放世界,不再局限于實驗室了。
智元機器人合夥人、研究院執行院長、具身業務部總裁姚卯青表示,智元對于 AI 技術的投入是戰略級的,非常堅定,今年也将開始規模化的生產和交付,并不會去顯著将一些 AI 研發投入轉移到最終的終端售價上面。他認為,在智元啟元大模型 GO-1 下,智元機器人進入到 G3-G4 過程當中,能夠很好完成某一任務,同時也逐步具備這種通用能力。
" 機器人公司如果不做大模型,那是屬于沒有未來的,機器人沒有智能化、沒有作業能力只是一個硬體,他能做的事情非常有限。"姚卯青對钛媒體 AGI 等強調,未來,AI 能力一定是區分機器人產品競争力的核心。硬體也許大家會有一些類似的方案逐漸收斂,供應鏈也會高度整合,那麼在最後大家比拼一定是 AI 的能力,這對于機器人落地和自主作業能力至關重要。
據悉,成立于 2023 年的智元機器人,是當前國内人形機器人賽道頭部企業之一,其創始人之一彭志輝是坐擁 250 多萬粉絲的 B 站 UP 主 " 稚晖君 "。
公司成立不到 1 個月,智元就完成天使輪融資、年内更斬獲 4 次融資,成立僅 6 個月就發布首款人形機器人,2024 年還發布五款商用人形機器人新品,并且去年底開源百萬真實機器人數據集,以及年初率先達成 1000 台機器人量產等,引發行業關注。
截至目前,智元機器人已完成天使輪、A1、A1+ 等多輪融資,累計募資總額超過 16 億元。
智元機器人共有三條主打產品線,分别是遠征、Genie 和靈犀。
事實上,現有具身模型面臨多個落地困境,包括泛化性差,到新場景時成功率大幅下降;擴展新任務時需要大量數據,落地成本高;不同本體的數據無法共用,數據成本高;模型無法持續進化;DP/ACT 等具身小模型技能單一且無法快速學習新技能,GR-1/2 等模型無法構建通用的場景感知、指令理解等能力,語義指令泛化受限,以及小樣本泛化到新場景 / 新任務能力較弱等。
如今,智元希望解決上述一系列問題,并于今天發布了首個具身基座大模型 Genie Operator-1 ( GO-1 ) 。
這是全球第一個基于大規模、高質量自有數據,基于自有機器人本體訓練并部署的機器人基座模型。
該模型開創性地提出了 Vision-Language-Latent-Action (ViLLA) 架構,該架構由 VLM(多模态大模型) + MoE(混合專家)組成,其中 VLM 借助海量互聯網圖文數據獲得通用場景感知和語言理解能力,MoE 中的 Latent Planner(隐式規劃器)借助大量跨本體和人類操作視頻數據獲得通用的動作理解能力,MoE 中的 Action Expert(動作專家)借助百萬真機數據獲得精細的動作執行能力,三者環環相扣,實現了可以利用人類視頻學習,完成小樣本快速泛化,降低了具身智能門檻,并成功部署到智元多款機器人本體。
Genie Operator-1 有五大特點:采訓推一體,搭配智元軟硬體一體化框架,可以實現數據采集、模型訓練、模型推理的無縫銜接;小樣本快速泛化,具有強大的泛化能力,使得後訓練成本非常低,能夠在極少數據甚至零樣本下泛化到新場景、新任務;一腦多形,是一個通用機器人策略模型,能夠在不同機器人形态之間遷移,快速适配到不同本體;持續進化,搭配智元一整套數據回流系統,可以從實際執行遇到的問題數據中持續進化學習;人類視頻學習,可以結合互聯網視頻和真實人類示範進行學習,增強模型對人類行為的理解。
據智元介紹,相比已有的最優模型,GO-1 平均成功率提高了 32%(46%->78%)。其中,在執行 "Pour Water"(倒水)、"Table Bussing"(清理桌面) 和 "Restock Beverage"(補充飲料) 任務表現尤為突出。
智元機器人方面表示,GO-1 的出現,為機器人代替人類完成工作生活中的各種事情,提供了強大的腦力支持。從準備餐食、收拾桌面這樣的家庭場景任務,到接待訪客、發放物品這類辦公和商業場景的常見工作,再到工業等更多場景的其他操作任務,通用具身基座大模型都可以快速實現。這也意味着 " 具身智能 " 從單一任務到多種任務、從封閉環境到開放世界、從預設程式到指令泛化加速邁進,讓機器人走向更多不同場景、适應多變的真實世界。
此外,任廣輝透露,公司已與階躍星辰合作,後續圍繞階躍的多模态、推理和訓練、工程化等底層模型能力,進行深度的合作,将階躍星辰多模态等能力賦能到機器人上面。
在姚卯青看來,利用 AI 大模型,能夠助力機器人操作上手能力,從而加速進入工廠、零售、服務業等場景工作,長期還能進入家庭。" 這才是機器人價值被充分發揮的時刻。"
談到最受關注的 9.9 萬元機器人話題,姚卯青對钛媒體 AGI 獨家表示,9 萬 9 的機器人只具備基礎運動能力,在本體、硬體、算法都還沒有收斂的情況下,大家急着 " 卷 " 價格戰,沒有什麼意義。因此,姚卯青呼籲人形機器人產業需要看產品競争力,如果都達不到給用戶創造價值的時候打 9.9 萬元,只會把整個行業變成一個很不健康的狀态。
姚卯青強調,未來 1-2 年,人形機器人能夠在局部工業場景應用落地,機器人走進家庭還需要 5 年左右的時間。此外,機器人實現像人一樣有通用能力的物理世界 AGI(通用人工智能)還需要 5-10 年時間。
據钛媒體 AGI 獨家了解,預計 2025 年第二季度,智元将會推出基于強化學習的仿真模型,今年下半年,智元機器人将發布 X2 等多個新款商用機器人產品,以及 " 靈巧手 " 等多個新技術,加速推進 2025 年智元 10 倍營收增長目标。
(本文首發于钛媒體 App,作者|林志佳)