今天小編分享的互聯網經驗:将情感植入陪伴機器人,「可以科技」自研人機互動智能決策模型 ,歡迎閱讀。
文 | 周鑫雨
編輯 | 鄧詠儀
" 情感互動 " 正在成為機器邁向 AGI 的下一個戰場。
近幾年随着 AI 技術的迅速演進,機器學習的領網域逐漸從文字、影像、視頻等模态,轉向更為復雜的情感識别。在情感識别技術發展下," 陪伴機器人 " 已發展為具有潛力的細分賽道。Precision Reports 數據顯示,2023 年全球陪伴機器人市場規模預估為 920311 萬美元,未來 5 年年復合增長率預計達到 25.68%。
成立于 2014 年,可以科技是 36 氪長期關注的機器人企業。其首款產品 ClicBot(可立寶)為可自由組裝構型的模塊化機器人。ClicBot 好比可自由組裝成遙控車、機械臂、機械寵物等形态的機器人樂高,用戶可通過搭積木般的拼接以及功能程式編寫,DIY 具有不同功能的機器人。
在生成式 AI 技術逐漸成熟的當下,可以科技的第二代產品、陪伴機器人 Loona 則将功能重點從樂高般的 DIY,轉移到了人機互動。36 氪曾有關 Loona 的功能做過詳細的介紹。
Loona 與狗對視。圖源:可以科技
可以科技創始人兼 CEO 楊健勃告訴 36 氪,Loona 的 " 寵物 " 形态來源于 ClicBot 中最受用戶歡迎的構型。這一現象側面反映出,用戶對于機器提供類生命體的智能互動具有較高的需求," 我們想通過 Loona 打造下一代機器人智能決策機(Intelligent decision making machine)通過智能決策機,可以讓機器人能夠通過多模态地信息流暢地表達情感,讓機器人真正懂人 "。而情感互動可以将機器人人機互動體驗從 " 理解命令 " 提升到 " 懂你 ",讓機器人可以自由地表達情感。
Loona 被摸頭。圖源:可以科技
想在機器人上實現智能情感互動,需要在感知、決策、執行三個環節構建完整的軟硬體系統。
作為建立人類情感模型的先決條件,高質量的人機情感互動數據一直是稀缺資源。楊健勃告訴 36 氪,數據采集的難點主要有二:一是需要雙相互動,二是需要脫敏,不侵犯個人隐私。
為此,可以科技通過深度強化學習算法建立了一條從視覺感知、到生成式情感互動 AI 模型的通路。
在感知層,作為能夠 " 讀空氣 " 的寵物,Loona 的情感反饋來源于一整套復雜的視覺軟硬體系統。作為 " 眼睛 ",Loona 搭載的 3D-ToF 攝像頭等感知元件和算法可以實現人臉識别、身體檢測、動态靜态手勢識别、人體骨骼識别、3D 動作捕捉、物體識别、情感感知、寵物識别、場景識别、标志識别等感知功能。
Loona 玩球。圖源:可以科技
在決策層,在基于機器人收集到的脫敏互動數據,可以科技将 Loona 的基于數據庫索引的互動模型轉換成了基于深度學習的 AI 模型,繼而則是通過 Loona 實機進行強化學習。目前,Loona 擁有高日活躍率和持續提升的銷量,基于用戶反饋,Loona 的強化學習可以建立起數據飛輪。
在執行層,基于以上兩環構建的智能情感決策模型,可以科技正在研究一套實時互動生成系統。楊健勃介紹,以往 Loona 的情感表達采用的是由設計師提前設計的表情動作和音效來表達。接入情感決策模型後,Loona 的表情、動作和音效能根據用戶的互動實時生成,比如 Loona 的 " 眼球 " 能根據用戶的表達轉動,将互動周期從十幾秒縮短到毫秒級。未來,Loona 的實時互動系統還将持續更新。
Loona 與孩子一起玩耍。圖源:可以科技
" 決策模型會颠覆掉 Loona 以往的互動方式。" 楊健勃對 36 氪表示," 指令和功能的概念會變得不重要,因為 Loona 能夠實時理解人類的意圖,再自然地做出互動。"
而作為智能決策機,楊健勃認為 Loona 與寵物陪伴或人類陪伴并非替代關系,而是關系的有機補充," 生物的進化有特殊的性能,目前 AI 側難以提供真實的感覺。但機器人的優勢在于能夠從更多維度理解人且做出反饋,也更穩定。相信它們将和寵物、人類有機共存。"
歡迎交流