今天小編分享的互聯網經驗:OpenAI聯合創始人:自動駕駛和VR都是“歧途” AI智能體才是未來,歡迎閲讀。
在黃仁勳和馬斯克接連看到了 AI 智能體的發展潛力後,OpenAI 聯合創始人,特斯拉前人工智能總監 Andrej Karpathy 也在最近高呼,AI 智能體代表着一個瘋狂的未來。
Andrej Karpathy 直言,自己在特斯拉的工作時 " 被自動駕駛分了心 ",鑽研自動駕駛和 VR 都不是發展 AI 智能體的正确道路。此刻正是回歸神經科學,從中尋求靈感的時刻。
另一方面,Andrej Karpathy 認為每個人在構建 AI 智能體的方面都比 OpenAI 這樣的公司更有優勢,大家目前處于平等競争的狀态,因此他很期待看到這方面的成果:
AI 智能體代表着一個瘋狂的未來,雖然可能還有點遠,但是今天到場的大家構建的 AI 智能體已經處于 AI 智能體能力的最前沿。
現在所有正在做大語言模型的機構,比如 OpenAI 等,我覺得都沒有處于這個領網域的最前,最前沿的是在座的各位。
谷歌旗下 AI 團隊 DeepMind 的最新論文介紹了一種能夠進行自我改進的 AI 智能體—— RoboCat,本質上是由 AI 賦能的軟體程式,相當于機器人的 " 大腦 "。由其加持的機器人與傳統機器人不同之處在于,RoboCat 更具 " 通用性 ",并可實現自我改進、自我提升。
具身智能比人形機器人更有價值
具身智能相當于 AI 的大腦,而這個大腦的載體可以是任何形式。可以是一個機械臂,一只機器狗,更或者是一輛小汽車。
而反觀人形機器人,當下為何被看做是一個不太聰明的鋼鐵巨人,核心還是因為缺少 AI 大腦 + 不太靈活的軀體。
簡單來説,類似 GPT-4 這樣的大模型,對物理世界并不能真的產生影響,而具身智能則多了一個身體,通過傳感器收集環境信息,利用機械執行器進行物理操作,或者通過機器人等具體實體與人類和環境進行實時互動。
馬斯克曾説,雖然未來有一天人人可能會擁有一個人形機器人,但是目前展現的 Optimus 人形機器人產品也就只能執行重復性的簡單勞動。
具身智能的目标是使機器能夠更好地理解和适應復雜的環境,更高效地解決問題,并具備更靈活的行為能力。通過融合感知、決策和執行的過程,具身智能使機器能夠更接近人類智能的表現,從而在機器人技術、自動駕駛、智能制造等領網域發揮重要作用。
Karpathy 直言,在 7 年前,研究 AI 智能體的時機還不成熟,因技術所限做出來的效果不好,于是他和 OpenAI 就改變了方向,開始研究大語言模型。
而現在有了全新的技術手段來研究 AI 智能體,情況和 2016 年完全不同了:
最簡單的例子就是,現在沒有人再像 2016 年那樣用強化學習的方法來研究 AI 智能體了。現在的研究方法和方向在當年是不可想象的。
AI 下一個浪潮?
大語言模型的出現,給構建具身智能體帶來了全新的可能性。因為基于 LLM 的智能體可以利用預訓練模型中藴含的世界知識,生成一致的行動計劃或可執行策略,這就非常适合應用于遊戲和機器人之類的任務。
DeepMind 的 RoboCat 只是 AI 賦能機器人的主要案例之一。
今年以來,已經有數家公司将語言模型運用到了機器人上:2023 年年初,谷歌推出視覺語言模型 PaLM-E,并運用到工業機器人上;4 月,阿裏巴巴将千問大模型接入工業機器人;5 月,特斯拉人形機器人 Optimus 展示了精準的控制、感知能力,同月,英偉達發布全新自主移動機器人平台。
得益于此,人工智能加持的機器人化身具身智能吸引了全球的廣泛關注。
馬斯克在特斯拉 2023 年股東大會上便表示,人形機器人将是今後特斯拉主要的長期價值來源:
" 如果人形機器人和人的比例是 2 比 1 左右,那麼人們對機器人的需求量可能是 100 億乃至 200 億個,遠超電動車的數量 "。
英偉達創始人黃仁勳在 ITF World 2023 半導體大會上也表示,AI 下一個浪潮将是 " 具身智能 "。華爾街見聞此前指出,國盛證券分析師認為,具身智能有着物理反饋、物理輸出的特性,可以成為成為通信、計算和存儲的新載體:
未來具身智能将會越來越強調邊緣通信能力與邊緣算力的匹配和耦合。
AI 的軀體其實并非是最重要的,核心應該是發展 AI 大腦,打通人機互動方式,讓 AI 能夠主動感知物理世界,拟人化的思維路徑才能做到人類期待的行為反饋。機器視覺和多模态大模型正是開啓這個世界的兩把鑰匙。