今天小編分享的科技經驗:LAM大動作模型興起!這才是我們想要的AI!,歡迎閲讀。
在悄無聲息中,具有裏程碑價值的 GPT-3.5 問世已滿一年。在這一年的時間裏,我們不僅見證了,還親自參與了科技界的歷史性變革。基于大型語言模型(LLMs)的各種 AI 對話應用已經遍布我們生活的每一個角落。許多人已經不再依賴于打開搜索引擎來解決問題,而是轉向與 AI 對話尋求答案。
By Midjourney
但也有不少小夥伴在使用過一段時間後,覺得有些無聊。确實,當前的 AI 雖然可以在對話框中跟你侃侃而談,而卻不能幫你解決一些實際問題。比如説幫你訂個飛機票,叫個出租車,或者當你想要在 PS 中把這個照片的背景 P 掉的時候,這些對話框只會給你具體操作的步驟,卻不能幫你去完成。不少用户渴望的是一個更能動手實際操作的 AI,不僅能夠提供信息,還能夠執行具體任務。
懶,才是人類的第一生產力。正是這種對舒适與便捷的渴望,孕育出了一系列劃時代的產品。如今,為了滿足人們希望 AI 能夠協助解決實際問題的願望,大型動作模型(LAMs)應運而生,它們的目标是讓 AI 的能力不僅限于提供信息和執行虛拟任務,而是擴展到現實世界的物理動作中,進一步釋放人類從日常瑣事中的束縛。
By DALL-E 3
在 2023 年 12 月初,一家創新的研究團隊 Rabbit 搶先發布了他們的首個大型動作模型系統—— Rabbit OS。
圖片源自互聯網
Rabbit 團隊闡述,Rabbit OS 并不是建立在像 ChatGPT 這樣的大型語言模型上,而是創新性地構建在 " 大型操作模型 " 之上。它在概念上與 Google Assistant 類。Rabbit OS 能夠通過一個統一的界面來實現音樂控制、點個外賣、打個滴滴、買個飛機票、買張電影票,給女友買束花以及購買生活必需品等多種任務。用户不必切換不同的應用程式或者重復登錄——只需告訴 Rabbit OS 你需要什麼,它就能幫你搞定。
這個 LAM 的概念發布之後,就引起了老外的強烈關注,畢竟這個邏輯鏈是完全正确的,當 LLMs 已經成熟的時候,人們只需要與 AI 對話,AI 便可以準确清晰地理解你的意圖,并直接通過 LAMs 實現你想要的現實操作。
于是 Rabbit 順水推舟地發布了,旗下第一款加載了 LAMs Rabbit OS 的 Rabbit R1。
Rabbit R1 看起來有點像是過去 90 年代的旋鈕電視的縮小版,圓潤外觀是與知名設計公司 Teenage Engineering 的深度合作成果,正面左側 2/3 是螢幕,另外一部分是控制區與攝像頭,看起來非常具有復古感。
設計緊湊,體積僅為 iPhone 一半大小的 R1,搭載了一塊 2.88 英寸的觸摸屏,并配備一個旋轉攝像頭,可以輕松拍攝照片和視頻。此外,通過獨特的滾輪 / 按鈕,用户可以方便地浏覽内容或與設備内置的助手進行互動。
性能方面,Rabbit R1 内置了一顆 2.3GHz 的聯發科八核處理器,使用了 4GB+128GB 的存儲組合,對于這種小型設備來説,性能足夠用了。
這款設備售價為 199 美元(約折合 1450 元人民币),對于一款新公司的初代產品來説,這個價格已經是非常良心了,初代量產的 1 萬台,也于發布後的當天下午售罄。
那麼,Rabbit R1 可以幫用户幹什麼呢?根據已經上手過的老外介紹,Rabbit R1 是一個語音互動式智能設備,用户無需打開應用程式,直接通過物理按鍵與其對話互動,就可以實現手機上音樂軟體開始播放或自動打車等,有點像是對講機的實現邏輯,仿佛對講機對面真的有一個私人秘書在幫你實現這一切。
Rabbit R1 将應用程式與用户的在線賬户連接起來,并使用其自研的大型動作模型來解析語音命令,輔以 GPT 語言模型(主要負責轉換人類的指令為文本并進行解讀)來完成任務。它允許用户通過語音指令定制個性化操作,無須開發特定的 API。該設備的動作模型通過分析人與應用程式的互動來學習操作方法。
讓 AI 從對話框走向現實,這可能就是 Rabbit 開發 LAM 以及發布 Rabbit R1 的意義,實體化的操作邏輯與獨特的動作學習功能,讓 Rabbit R1 在海外的好評不斷。
在這個 AI 迸發的時代,各大 AI 科技公司都推出了自己的大型語言模型(LLM)應用,如 GPT、Bard 以及國内的文言一心、月之暗面、通義千問等,這些產品的多樣性往往讓用户感到困惑。而 Rabbit 的策略則完全不同,它通過一個界面連接不同的應用,以解決用户的實際問題,類似于一個多功能的超級應用程式,用户可以通過這一平台完成幾乎所有的任務,體驗一站式的便捷 AI 服務。
展望未來,我們期待地看到 LAMs(大型動作模型)的集成範圍擴大到更多的智能家居設備、智能汽車和智能公共設施中。這種融合有望實現真正的人機對話——用户只需簡單發出口頭指令,設備便能自動識别、理解和執行所需的操作。這将是一個巨大的躍進,将極大地提高生活的便利性和效率,而且還将為殘障人士和其他需要輔助技術的群體提供更大的自主性和支持。