今天小編分享的科技經驗:這款長得像「掌機」的設備,會是AI時代的iPhone嗎?,歡迎閱讀。
過去幾年,不少人都認為在個人電腦和智能手機之後,AR 設備将成為下一代個人計算平台。而在 ChatGPT 之後,有一部分人先改變了自己的觀點,認為在生成式 AI 技術之上,将長出真正的下一代個人計算平台。
今時今日,個人 AI 專用設備到底有沒有戲,仍然是一個充滿懸念的問題。但至少在今年的 CES 上,rabbit r1 再一次證明了一點:确實有人願意為個人 AI 專用設備買單。
1 月 11 日,初創公司 Rabbit 官方在 X(Twitter)上宣布首日就賣出了 1 萬台 rabbit r1,比起他們内部設想的 500 台高了整整 20 倍,同時還表示第二批 rabbit r1 訂單預計将于 4 月到 5 月交付。
圖 / X@Rabbit
考慮到 199 美元的售價,等于說 rabbit r1 還沒正式交付就在第一天就產生了 200 萬美元(約合人民币 1419 萬元)的銷售收入。
不只是 Rabbit 官方,很多人也沒有想到 rabbit r1 會取得如此漂亮的開頭,甚至有人又喊出了「AI 時代的 iPhone 時刻」(This is the iPhone moment for the AI Era)。當然也有人嚴重懷疑 rabbit r1 的意義,還認為一旦手機廠商将大模型集成到語音助手上,直接就會殺死 rabbit r1 這類產品。
所以 rabbit r1 到底是什麼樣一款產品?
rabbit r1 是一個完全獨立的硬體設備,尺寸不到一個巴掌大,正面搭載了一塊 2.88 英寸的觸摸顯示屏,除此之外全采用了橙色塗裝。
螢幕右側有一個模拟滾輪,再上方還有一個可以 360° 旋轉的攝像頭,不使用的時候朝上或朝下,使用的時候可以朝前作為前置攝像頭,或是朝後作為後置攝像頭。機身左側,rabbit r1 配備了唯一一個 Type-C 接口,機身右側則有一個最最重要的實體按鍵——按住就能開啟「對話」。
圖 / Rabbit
此外,rabbit r1 支持 WiFi 和蜂窩網絡連接,還配備了 2.3GHz 聯發科 Helio P35 芯片、4GB 内存以及 128GB 存儲空間,官方宣稱滿電續航為「一整天」。
rabbit r1 在硬體部分就到此為止,但不管從宣發還是 Rabbit 官網上的介紹都可以看出,rabbit r1 上搭載的 rabbit OS 才是真正的核心。
rabbit r1 的互動,或者說使用方式非常簡單,按住「對話」按鈕并發出語音指令,rabbit OS 就能利用生成式 AI 技術理解并拆解,再由此進行相應的操作和反饋。
舉個例子,雷科技參加本屆 CES 大會的編輯「一位天明」因為要趕不同區網域不同展館(很多時候距離很遠)的活動,需要頻繁叫 Uber,如果在手機上互動每一次基本都需要重復「解鎖」「打開 Uber App」「輸入目的地」「确認訂單」等步驟。
但在 rabbit r1,用戶可以直接按住「對話」按鈕并說,「幫我叫一輛 Uber 去 xxx(地點)。」機器會自動化解析指令并執行一系列操作,在雲端完成叫 Uber 的所有操作流程,最後輸出呈現車牌号、車型等必要的信息。再比如,rabbit r1 也能連接 Spotify 賬戶播放音樂、預訂機票等等(賬戶需要在 Raddit Hole 自行連接)。
此外,利用 360° 旋轉的攝像頭,rabbit r1 也能進行基本的視頻通話,還包括執行一些最新的計算機視覺應用,但官方暫未提供更明确的信息,或許相關功能或軟體支持還沒有到位。
總的來說,rabbit r1 本身并不搭載各種 App,而是利用最新的生成式 AI 理解用戶的「自然語言」,再通過雲端拆解以及自動化操作完成指令。按照 Rabbit 官方的說法,rabbit r1 目前僅支持部分主流應用,但也有「學習」能力:
> rabbit OS 是第一個建立在 Large Action Model(LAM)上的作業系統,該模型将學習用戶使用特定應用的意圖和行為,然後模仿和執行。
與我們更常聽到的大型語言模型 Large language model(LLM)不同,Rabbit 所謂的 LAM 大型動作模型,雖然同樣要先理解用戶說出的話,但 LAM 更側重于理解人類如何使用應用和服務并進行模仿操作,而不是依賴于 API 接口。
官方表示,LAM 基于互聯網上大量消費者發布的應用程式界面進行訓練,而且随着訓練數據的增多和質量的提升,LAM 的能力還能更強。在訓練模式下,rabbit OS 還支持用戶個性化訓練自己專屬的 LAM 模型。
剝離掉「LAM 模型」的概念,其實不難理解 Rabbit 正在做的事,無非就是利用最新的 AI 技術,将語音作為人機互動的主要方式。這也是個人 AI 設備最關鍵的一點。
按照官網信息,Rabbit 是一家總部位于加州洛杉矶的初創公司,創始人兼 CEO 呂騁(Jesse Lyu)之前是智能音箱公司渡鴉的創始人,在渡鴉被百度收購不久後就退出了。
呂騁和渡鴉音箱,圖 / 百度
從這個角度來看,Rabbit 的出現并不意外,不管是渡鴉智能音箱,還是 rabbit r1,說到底出發點都是将語音互動視為未來人機互動的主要方式之一。
但不僅是 rabbit r1,去年火出圈的另一款支持 GPT 模型的個人 AI 設備—— AI Pin,也是由一家初創公司 Humane 開發并推出。同樣也是很簡單的一款產品,AI Pin 甚至沒有螢幕,雖然還有在手掌投影的功能,但幾乎可以說是依靠語音和攝像頭進行所有的互動和反饋。
AI Pin,圖 / Humane
在多次報道大模型的文章中,我們都有提到一個觀點:當大模型帶來了 AI 理解能力的飛躍,很可能将徹底改變人機互動的主要方式。事實也證明了,手機廠商、初創硬體公司以及大模型廠商都在圍繞「對話」的互動變革來開發和更新新的產品。
Humane 的兩位創始人均來自蘋果公司,曾共同參與 Mac、iPod、iPad、iPhone、Apple Watch 和 iOS 的研發。一位專注于用戶界面和互動,協助發明了第一代 iPhone 中首次亮相的滑動解鎖功能。另一位是軟體工程總監,幫助推出了初代 iPad。
有趣的是,Humane 的總部就在加州的另一大城市——舊金山,這裡還有一家如今無人不知、無人不曉的公司—— OpenAI。
早在去年 9 月,The Information 就曝出 OpenAI CEO Sam Altman 與前蘋果傳奇設計師 Jony Ive、軟銀創始人孫正義已經在商讨開發一種全新的 AI 設備,後來還有消息指出即将離任的蘋果產品設計副總裁 Tang Tan 也将參與該項目。
小雷不知道這個項目到底會做出什麼樣的產品,但幾乎可以笃定,它一定也在圍繞新的人機互動方式進行構建。
CES(美國拉斯維加斯國際消費類電子產品展覽會) 2024 火熱進行時,雷科技編輯 " 一位天明 " 正在美國 · 拉斯維加斯現場直擊報道,歡迎在雷科技微信(ID:leitech)、微博、微頭條獲取 CES2024 一手觀察。