今天小編分享的科學經驗:首次寫入政府工作報告!這個科技新詞“具身智能”到底是什麼?,歡迎閲讀。
在 2025 年 3 月 5 日在第十四屆全國人民代表大會第三次會議上的政府工作報告中,特别提到了 " 具身智能 "。
圖片截自中華人民共和國中央人民政府網站 www.gov.cn
那麼具身智能到底是什麼呢?
圖庫版權圖片,轉載使用可能引發版權糾紛
回想我們看過的科幻電影,經典的機器人角色有很多——從冷酷強悍的殺手,到矯健的拳擊運動員,從穩重冷靜的維修工,到神煩碎嘴的禮儀官……不過,這些作品中的想象很美好,但實現起來真的很難——甚至光是讓機器人像人那樣邁開兩條腿走路,都歷盡坎坷。
反觀我們人類的小寶寶,成長過程中也沒有人給他們編什麼程式,經過多次嘗試和摔倒之後,他們自己就學會了爬和走,很快就能跑得飛快并躲開障礙。而 " 具身智能 " 技術,就參考了這個過程——這項技術能讓機器人像人那樣,用身體感知世界,在互動學習中成長。
具身智能是什麼,
是怎麼跟機器人結合的 ?
具身智能,英文全稱是 "Embodied Artificial Intelligence",從這個全稱我們可以看出,其實具身智能這個詞中的 " 智能 " 就是 " AI "(人工智能)的意思。而説到 AI ,大家早都不陌生了,從 ChatGpt 到 DeepSeek ,都是 AI 的一種。它們就像沒有身體的 " 大腦 ",雖然能從外部接收數據并解決問題,但它們作為沒有身體的軟體系統,缺乏通過身體與環境互動的能力和反饋機制。
圖庫版權圖片,轉載使用可能引發版權糾紛
舉個例子,下圍棋的 AlphaGo ,就必須有一位工作人員在場上幫它落子,因為 AlphaGo 是個純算法系統,盡管能在伺服器上快速訓練成千上萬場棋局,甚至能夠戰勝世界冠軍,但它自己甚至根本不具備在真實世界中拿起一枚棋子的能力。而具身智能機器人,則能通過攝像頭、觸覺及其他傳感器等 " 感官 " 收集環境信息,并用肢體與環境互動,進而形成 " 感知 - 行動 " 的閉環。
了解了上面的信息,再解釋具身智能相關的概念就比較容易理解了,所謂 " 具身智能 " 是指一種基于物理身體進行感知和行動的智能系統,其通過智能體與環境的互動獲取信息、理解問題、做出決策并實現行動,從而產生智能行為和适應性。總結一下,具身智能就是 " 能夠感知、推理并與物理世界互動的智能系統 "。而具身智能機器人,可以視為具身智能系統的載體。
那麼," 具身智能機器人 " 可以簡單理解為 " 給 AI 套了一具身體 " 或 " 給機器人裝上了一個 AI " 嗎?這種認識也是不全面的。舉個例子,現在有一些機器人產品,能夠做一些簡單的動作,也連上了 AI ,甚至可以跟人聊得有來有回,但它們仍然不能算是具身智能。
這是因為它缺少了至關重要的一環,也就是 " 具身智能 " 中的 " 具身性 "(Embodiment)。而具身性的核心在于,智能必須通過物理身體與環境的實時互動和動态反饋來生成,而非依賴預設程式或離線數據,要靠深度融合人工智能與機器人兩大前沿技術才能實現這個目标,簡單 " 拼 " 在一起是不行的。
為什麼我們需要具身智能機器人?
其實現在已經有很多機器人在幫助人類勞動了,但很多機器人工作的時候依賴預先編好的程式,我們經常能看到工廠生產線中的機械臂(也是機器人的一種),它們高效默契地運行,能有條不紊地進行搬運、焊接等工作。這類機械臂通常高度依賴編程行動,雖然可以分毫不差地運行,也集成了一些基本的傳感器以便了解工作狀态,但遇到突發情況卻仍然 " 不懂 " 避讓行人(在無需工人的生產線上通常也沒有必要)。
這也是為什麼很多工廠的機械臂操作區都要裝上隔離網,标上警戒線。因為這些機械臂工作時 " 只認程式不認人 ",雖然有大量安全相關的措施和規章制度保障,但如果有人疏忽大意踏入它們的工作範圍,仍可能發生悲劇——面對嚴格按程式從 A 點運動到 B 點的機械臂,擋在路上的人體實在太脆弱了。
試想一下,你敢讓這樣一個一個 " 只認程式 " 的機器人,走進你的家中,幫你打理家務,照顧老人小孩嗎?當然,現在很多流水線上用的工業機器人也有了碰撞檢測等功能,變得更加安全,但它們仍然是按預設程式執行,缺乏動态學習能力,更适合執行簡單的重復任務。而一旦面臨復雜的環境和任務,只靠預設程式是行不通的,因為在復雜環境下,很難窮盡所有的規則。
這裏再舉個例子,在汽車制造業中,諸如搬運物料、抛光、焊接、噴漆等加工工序,大部分可以用機器人輕松完成。但是到了發動機、底盤、電器等裝配工序,大部分工作仍難以用機器人完成,因為這些工作更加復雜,更需要 " 随機應變 " 以及溝通合作,機器人還無法勝任,需要人工。
而具身智能,則更加靈活,具有适應環境解決復雜任務的潛力,要想讓機器人實現更加廣泛的應用并走進千家萬户,需要發展具身智能。
具身智能機器人," 活學活用 "
由于具身智能和機器人的技術非常復雜,也有很多不同的技術路線,下面僅以具身智能開源學習項目 LeRobot 為例,簡單介紹一下具身智能機器人的基本特點。
筆者自己學習 LeRobot 時調試機械臂
假設我們的任務目标是讓機械臂撿起黃色的小積木塊,再放進盒子裏。我們可以編程式直接 " 命令 " 機械臂嚴格按照規定路徑和動作運行——很多生產線上的工業機器人正是如此,但只要積木換個地方,機械臂按之前的行動路徑就會撿個空。我們也可以編程式讓機械臂能識别出積木塊,再執行 " 撿 " 的動作并放進盒子裏,這樣更加靈活,但仍需要事先編寫相應的程式。
而 LeRobot 則是靠人操作主動臂," 手把手 " 地教從動臂完成一次撿起積木放進盒子的過程,從動臂運動的整個過程會被 2 個不同位置的攝像頭全程監控并記錄。改變幾次積木位置,操縱機械臂重復數十到上百次撿起和放下的動作,就能獲得足夠的資料。
LeRobot 的一次訓練過程 來自 Huggingface 官方教程
再通過算法 " 學習 " 這些資料,就能讓這套系統 " 學會 " 撿積木——如果有積木塊出現在機械臂面前,它就會自己拿起積木來放進盒子。
LeRobot 一次成功的自主拾取過程 來自 Huggingface 官方教程
上圖中,研究人員并沒有操作主臂,甚至積木的位置也改變了,但機械臂仍然能自主完成任務。
從上面這個簡單的例子中,我們能了解具身智能的一些最基本的特點。首先,具身智能可以通過身體與環境的實時互動學習(多次撿起積木),不用事先編寫大量規則窮盡所有可能。其次,具身智能能夠在執行任務的過程中動态調整策略(積木換個地方也能撿到)。
當然,這只是個簡單的例子,實際上具身智能機器人的技術路線有很多,除了像上邊的例子中基于真實世界互動的,還有在虛拟環境中進行的仿真訓練以及二者相結合的等等。此外,具身智能機器人還能實現遠比撿起積木扔進盒子裏復雜得多的功能。比如行走、适應地形,模拟人的動作等等,不久之後,相信各類具身智能機器人,就能在更多的領網域發揮重要作用。
最後總結一下,具身智能和機器人技術的融合,将會讓未來的機器人變得更加能幹,甚至能理解和模拟簡單的感情互動。而且,對具身智能和機器人的持續投入,更将帶動從軟體到硬體的整個產業鏈的發展。
策劃制作
作者丨丁崝 科普作者
審核丨于乃功 北京工業大學機器人工程專業負責人,北京人工智能研究院機器人研究中心主任,博士生導師
策劃丨丁崝
審校丨徐來、林林
相關推薦
3.這個很容易被忽視的習慣,會讓大腦變笨!但很多人可能每天都在重復
4.一種 " 低成本 " 就能讓心情變好的方式,真的推薦你試試!
本文封面圖片及文内圖片來自版權圖庫
轉載使用可能引發版權糾紛
原創圖文轉載請後台回復 " 轉載 "
點亮 " 在看 "
一起漲知識!