今天小編分享的科技經驗:戴了「Ray-Ban Meta」兩個月,我開始相信 AI 眼鏡的未來,歡迎閱讀。
作者 | Li Yuan編輯 | 鄭玄
Meta 聯合雷朋推出的「Ray-Ban Meta」智能眼鏡(以下簡稱「Meta 眼鏡」),可能是 2024 年最受關注的智能產品。
自去年十月發售起,Meta 眼鏡已經在全球銷售了超 100 萬台。不過,其真實的銷售潛力遠不止于此——扎克伯格在許多場合提到,這款產品的需求量比預期更高,導致不少款式售罄,用戶只能買到最基礎的黑色款式。
Meta 眼鏡的銷量之高,甚至改變了扎克伯格的認知和 Meta 的戰略:「一年半前你問我什麼時候人們會更喜歡使用眼鏡作為主力設備使用,我會說要到眼鏡的顯示效果足夠好的時候。現在我認為可能有三種路徑,其中一種就是無顯示屏只具有人工智能的眼鏡。」扎克伯格講道。
Meta 眼鏡為眼鏡增加了攝像、耳機,和最引人注意的—— AI 功能。呼喚 Hey Meta,就可以與 Meta AI 對話。除此之外,這款眼鏡沒有加入任何 VR、AR 等增強顯示效果的技術。但消費者對這樣一副沒有顯示增強效果的眼鏡趨之若鹜。
這或許是比銷量更重要的,這款產品跨時代的意義所在。即在一種全新的互動範式下,我們或許正在見證智能眼鏡像無線耳機、智能手表一樣,成為一個數億乃至十億人每天使用的超級可穿戴設備。
為了驗證這個念頭,筆者自費購入了一台 Meta 眼鏡與它一起工作、娛樂、生活,深入使用了幾個月後,對于 AI 與眼鏡結合帶來的可能性,以及智能眼鏡的未來,筆者有了新的想法。
可以每天佩戴的智能眼鏡
首先必須要明确的一點是:從今天來看,AI 只能說是 Meta 眼鏡的一個添頭,賣爆本身還是因為這是一款好的眼鏡。
在 Meta 2023 年 9 月推出這款智能硬體之前,Meta 和雷朋曾在 2021 年 9 月推出其聯名的初代產品:Ray-Ban Stories。只看產品定義,兩代產品似乎變化不大:都是采用雷朋眼鏡的鏡框進行二次設計,為眼鏡增加了攝像和音頻功能。
不過初代產品,在兩年的全生命周期中,只賣出了 30 萬台。而 Meta 眼鏡,在 2023 年 9 月推出後,一個季度就賣出了 30 萬台,且銷量增幅穩定,加上 2024 年的上半年,Meta 眼鏡已經出貨量超過 100 萬台。
相比之下,2022 年,全球智能音頻眼鏡市場總出貨量只有 343 萬副,而同樣主打輕便的 AR 眼鏡產品,2023 年整年,全球消費級 AR 出貨量為 20.5 萬台。
什麼讓 Meta 眼鏡成為變數?
筆者認為 Meta 眼鏡的成功,可以總結為一句話:這是第一款可用,且有用的智能眼鏡。
前面提到,過去幾個月裡,筆者一直将 Meta 眼鏡作為主力眼鏡佩戴和使用。
這是一項不尋常的成就。
作為一個對于眼鏡的舒适度和美觀度要求偏高的消費者,能夠将 Meta 眼鏡作為主力眼鏡,首先意味着,Meta 雷朋智能眼鏡,做到了本身是一副好戴的眼鏡。
對于消費者而言,一副好戴的眼鏡意味着什麼?
首先是外觀。從外觀來看,Meta 雷朋眼鏡,與一副普通的雷朋太陽鏡非常相似。
Wayfarer 太陽鏡,非智能款與智能款的對比
除了眼鏡正面的邊角裝飾位置,有細微的差别,一副 Meta 眼鏡,看起來與一副普通的眼鏡差别很小。
美觀問題見仁見智,不過 Meta 眼鏡用雷朋經典的設計,盡可能地繞開了科技公司在美學上積累不足的問題。筆者曾經将 Headliner 的眼鏡給編輯部不少同事進行試戴,得到了「誰戴誰好看」的評價。
這一代的 Meta 眼鏡目前共推出了 Wayfarer(方框)、Headliner(圓框)、Skyler(貓眼)三種框架,每種框架有四種顏色可以選擇,鏡片可選墨鏡、變色、偏光和防藍光的選項,也可以買後由消費者自己去眼鏡店選購适配,盡可能給了消費者足夠多的選項。
其次是舒适度。Meta 眼鏡,官方重量為 48 克,已經接近了消費者佩戴眼鏡的舒适區。在使用 Meta 眼鏡作為主流眼鏡之前,筆者日常佩戴的眼鏡重約 30g,不常佩戴的大框變色眼鏡,則重約 40g。
Meta 眼鏡也着重保留了雷朋鏡框鏡腿的獨特設計。在鏡腿越過耳朵的位置,盡可能地保持了雷朋眼鏡原本的彎度和漸細的曲線,以保證佩戴的舒适。
筆者采訪的供應鏈人士告訴筆者,為了保證這樣的鏡腿曲線,Meta 沒有采用常見的長方形或雙橢圓型揚聲器,而是特意定制了異形揚聲器來保持鏡腿的設計感和舒适性。
在筆者實際的佩戴中,佩戴 Meta 眼鏡比起佩戴普通眼鏡,眼鏡的存在感還是明顯更強——由于重量的原因,眼鏡會更頻繁地滑落,舒适度比普通眼鏡差一些。不過,在長時間的佩戴中,這種不适感并沒有強烈到無法忽視,在最初的不适應過去之後,筆者可以完全将其視為一副偏重的眼鏡,進行正常佩戴。
不過,只有像眼鏡,還不足以奠定 Meta 眼鏡今日的成功。Meta 與雷朋聯名的初代產品,外觀與今日的 Meta 眼鏡幾乎相同,官方重量僅多出 1.2g。
能夠将 Meta 眼鏡作為主力眼鏡進行佩戴,更關鍵的因素是,Meta 眼鏡給了消費者一個足夠好的理由,讓其心甘情願地将 Meta 眼鏡作為主力眼鏡。而在這一代產品上,這一點是 Meta 的攝像和耳機功能。
在 Meta 眼鏡的初代版本中,已經存在這兩個功能,不過,當時這兩個功能的可用性并不高。而這一代的 Meta 眼鏡,則真正将這兩個功能做到了「可用」甚至「好用」。
第一次戴上 Meta 眼鏡,你會立刻感覺到 Meta 眼鏡的不同。筆者戴上的第一反應,就是被其揚聲器的音質驚豔。Meta 眼鏡的音質,與音質較好的開放式耳機不相上下,聽音樂也完全不覺得違和。
而視頻功能,更是令人驚喜。事實上,在購買雷朋眼鏡之前,筆者已經逐漸意識到有些記錄生活的拍照需求,使用手機難以滿足:比如在高速駕駛的情況下看到了美麗的風景、在騎馬的馬背上不允許攜帶手機的時候、在和兒童或寵物進行交流的時候等等。在這些場景下,掏出手機拍攝,并不是一個很好的解決方案。
之前的最優解是購買一個運動相機,不過随身攜帶運動相機,對于用戶的要求仍然太高了。Meta 眼鏡的出現讓我看到了一種新的可能。
事實上,已經有不少視頻創作者,因為這一功能成為第一代 Meta 眼鏡的閱聽人,不過第一代的 Meta 眼鏡的相機只有 500 萬像素,而新一代的 Meta 眼鏡更新至 1200 萬像素,第一次将視頻 / 拍照功能做到可用。
在新一代的 Meta 眼鏡上,只需要用右手長按鏡框上的一個按鈕,就可以開啟攝像功能。如果不願意用手操作,還可以選擇語音操作——喊一句「Hey Meta,開始錄制」。實際測試的效果來看,筆者認為已經接近幾年前手機的錄像水平,同時具有極強的防抖效果,最長錄制時間三分鍾。在高速轉動的遊戲設施上,Meta 眼鏡能仍然保持較為出色的攝影效果。
結合五麥克風陣列的豪華收音——不少錄音筆甚至不能達到五麥克風陣列的收音,戴着 Meta 眼鏡回看錄的視頻,能夠體驗到沉浸式的音頻體驗,能夠如身臨其境一樣,重新聽到當時錄視頻時不同方位傳來的聲音。
在筆者購買 Meta 眼鏡之前,曾經與幾位擁有 Meta 眼鏡的嘗鮮者進行交流,其中促成筆者購買的主要原因之一,就是他們幾位都沒有将其閒置,而是真實地在生活中長時間地使用。Meta 眼鏡高度可用的音視頻功能,是他們願意長時間使用最重要的原因。
其中一位用戶表示,他最喜歡在健身房裡一邊健身一邊用 Meta 眼鏡聽歌。而在筆者追問為什麼耳機不行時?他的回答是,「因為總是有可能,突然有有趣的東西出現想要拍攝。」
這一回答在當時看起來雖然有些随意,但在經過筆者自己的使用和與多名用戶交流後,發現有這個心态的不止他一個,而是 Meta 眼鏡粉絲們的共識。
眼鏡是近視者生活中無法離開的一個必需品,聽音樂、接打電話的長期需求,再加上一個記錄生活的「萬一」,讓 Meta 眼鏡的可用性超越了其佩戴的不舒适性,牢牢戴在每一個購買者的臉上。
Always on 的硬體與 AI 的化學反應
Meta 眼鏡在 2024 年 4 月,加入了新的 AI 功能。
在產品剛推出時,Meta 眼鏡本身也具備語音助手功能。用戶可以戴上眼鏡,呼喚「Hey Meta」連接特定的軟體,進行簡單操作,如撥打電話,調節音量或播放音樂。和現在的 Siri 作用相似,甚至更局限。
而讓 Meta 眼鏡正式成為目前最炙手可熱的 AI 硬體的,正是這次 4 月份的更新。Meta 在對外發布 Llama 3 大模型的同時,宣布 Meta 眼鏡的用戶,之後再呼喚 Hey Meta 時,除了可以使用之前的功能外,将能夠直接和由 Llama 3 的多模态的大模型對話。
除了最常見的問答之外,Meta AI 最亮點的能力在于可以使用語音命令「Hey Meta, look and...」,在這條命令後,Meta 眼鏡會自動調用攝像頭,拍下用戶當前正在看的場景,調用多模态大模型的能力,回答用戶的相關問題。
扎克伯格在社交媒體上親自表演了一段。
在呼喚 Hey Meta 後,扎克伯格對眼前的建築是什麼發出了提問。而 Meta AI 則迅速分析了提問瞬間 Meta 眼鏡拍下的照片,并返回一個簡短的答案。
在 Meta 新的固件更新中,還增加了對多輪對話的支持——在一輪大模型的回復結束後,會自動等待一段時間,用戶可以進行追問而不必再次使用 Hey Meta 作為開頭。
筆者也對 Meta 眼鏡的 AI 功能進行了深度體驗。
首先第一個優點,是 Meta AI極低的延遲。
每次提問後,Meta AI 會有一個一秒左右的思考提示音。在大量嘗試後,筆者發現,基本上所有的問題,無論是針對當前的視覺問題,還是普通的問答問題,Meta AI 基本上都能在一次提示音後給出回復。
筆者咨詢了相關的產業人員,產業人員猜測,這可能源自 Meta 眼鏡使用的高通 AR 1 芯片,在本地就對圖片進行了簡單的 token 化和預處理,才能達到這樣好的效果。
而或許與極低的延遲相關,Meta AI 本身能力并不是特别強,且 Meta 似乎對 AI 的回復進行了長度限制,超過一定長度後,Meta AI 的回復就會突然停止,這導致 Meta 眼鏡上的 AI 能力的另一個突出特征是:其能做的事,仍然很局限。
事實上,筆者曾經一度對于眼鏡中加入大模型的合理性產生懷疑。
以眼鏡 AI 最常宣傳的一個功能的物體識别功能為例,受限于大模型的實際能力,和 Meta AI 本身的限制,Meta AI 在識别物體上的精确性并不高。
例如,如果問 Meta AI 房間裡哪裡有可以喝水的設備,Meta AI 可以指出房間中有飲水機,而要問到更精确的,如識别一下筆者購買的栀子花到底是哪種花,Meta AI 則識别了三遍才正确識别。識别一把小木棍大概有多少根,則數出來的數量與真實情況差距甚遠。
在什麼情況下用戶會帶着眼鏡詢問大模型哪裡可以喝水呢?這樣的需求幾乎是完全人造的。識别花朵的需求雖然小眾,但是是真實的需求,但是用戶又為什麼不掏出手機,在已經優化地非常好的識别植物的 app 裡進行識别,而要使用不成熟的 AI,承受可能三次的錯誤呢?
在今年 9 月舉行的 Meta Connect 大會上,Meta 還為這款眼鏡加入了實時 AI 翻譯的功能。在現場演示中,扎克伯格講英語,另一個人講西班牙語,雙方進行了一場對話,智能眼鏡充當了翻譯。在這一點上,AI 的實用性似乎有所增強。不過,從效果來看,AI 的翻譯仍然還是有一定「時差」。
不過,當筆者真的将 Meta 眼鏡作為主力眼鏡,佩戴一個月之後,筆者意識到,一個 Always On 的設備 +AI,產生的化學反應,可能是全新的。
眼鏡,作為一個全天候架在眼前的設備,可以随時聆聽我的召喚。對比呼喚手機上的「Hey Siri」,智能家居中的「你好小愛同學」,對眼鏡呼喚「Hey Meta」,成本更低——無需在任何情況下考慮設備是否聽的見,聽得清,即使是在有雜音的地方低語,也能得到很好的回應。
改變是一點點發生的。
筆者原本使用 Siri 的主要場景,在于使用 Siri 快速放音樂,而 Meta 眼鏡,作為一個幾乎全天候佩戴的設備,很自然地成為了接收筆者語音指令的第一終端,也是控制音樂播放最方便的設備。Hey Meta 在這個場景下,輕而易舉地就超越了 Hey Siri,成為了我的首選。
而一旦習慣呼喚 Hey Meta,一些全新的,沒想過的自發需求就生長了出來。
比如,在無聊的路上,Meta AI 可以幫我念首詩,講點新聞,玩猜數字的遊戲。
比如,照鏡子的時候,我會呼喚 Hey Meta,幫我看看是否是一個合适的穿搭。
沒胃口的時候,也可以直接呼喚 Hey Meta,問問有沒有什麼可以合适夏天晚上吃的菜,有沒有好的商店在我附近。
這些需求,有的 Meta AI 可以滿足地很好——比如念一首詩,幫我提供夏夜适合吃的菜的靈感,而有的則暫時還做不到——比如騎行到一個陌生的地方幫我推薦一家附近的餐館。
相比手機,眼鏡有着獨特的位置優勢——全天候佩戴的屬性,加上是在臉上距離嘴巴最近的收音入口。讓筆者開始相信AI不斷進步的情況下,智能眼鏡有可能是比手機更适合作為 AI 載體的未來。
扎克伯格在接受采訪的時候也講到:「眼鏡替代手機,很可能像手機替代電腦一樣。并不是人們不再使用電腦了,而是在很多場景下,人們首先使用手機來完成,而不是電腦。」
AI 代替顯示技術,讓眼鏡成為第一入口的未來可見了
事實上,行業認為眼鏡能夠成為未來最重要的智能硬體的判斷由來已久。
2012 年,Google 就發布了 Google Glass 的原型機概念。Google Glass 的原型機概念是美好的:在眼鏡的右上方,增加一塊光機,把數字信号投入到眼睛裡。Google 希望這個眼鏡能夠做到替代部分手機功能——顯示天氣、消息、電話,用戶可以佩戴它進行拍照、錄影、導航等等。
Google Glass 願景雖好,但最終呈現的效果卻一般。續航短、發熱嚴重不說,最終能夠代替的手機的功能非常有限,無法承載新一代智能終端的願景。
而吸取了 Google Glass 的教訓,之後的智能眼鏡走向了兩個流派,一是不再強調替代手機的智能性,而将其主要作為一個消費電子的硬體來對待。如主打拍照分享的前三代 Snap Spectacles 眼鏡和主打音頻功能的 Bose 音頻眼鏡。
而另一個流派,則在顯示技術上不斷加碼,将越來越多的智能功能搬到眼鏡上,甚至是讓眼鏡的智能功能超越手機—— Meta 的 Quest 頭顯、蘋果的 Vision Pro 就是這一路線的代表。
然而優秀的顯示效果的代價,往往是沉重的重量,和常常被限制在家中遊戲和觀影的使用場景。眼鏡獲得了智能的能力,但是失去了 Always On 的場景——人們最初期待眼鏡能夠超越手機成為第一入口,看中的就是眼鏡更便攜,離用戶更近,如果抬眼就能調用智能功能,自然比手機更容易成為第一入口。
而 AI 技術的出現,或者将帶來第三條路。
在大語言模型技術出現之前,從手機、智能音箱再到 HoloLens 等 AR 眼鏡也曾引入語言互動,但在當時,只使用自然語言進行互動的效果,很難稱之為智能但只使用自然語言進行語音互動,幾乎很難稱之為智能,這意味着以語音互動為主無法支撐起一個計算平台。
而在今天,大語言模型技術的出現,讓單獨的語音互動的體驗,有了走向足夠智能的可能性。雖然今天 Meta 眼鏡上的 AI 仍然停留在互動玩具的級别,但我們完全可以預期随着大模型技術的發展,擁有攝像頭和 AI 的眼鏡能夠替代今天手機應用的不少場景——無論是點外賣、掃碼支付、獲得陪伴、問大語言模型商店是否具有針對性的優惠,實際上在技術上已經都不再是挑戰,差的只是平台的接口尚未打通。
而 AI 技術,也可能帶來很多新的智能能力,比如長期的陪伴,針對個人生活場景真正個性化的推薦等等。
另外一個不可忽視的因素:經過 10 多年的發展,智能眼鏡的幾項關鍵技術都在近些年取得了突破,這也是 Meta 眼鏡取得成功,以及支撐智能眼鏡在未來幾年快速增長的重要因素。
幾名熟悉供應鏈的業内人士告訴筆者,在 Google Glass 時代,使用眼鏡進行拍照、甚至進行一定的 AI 功能,續航和發熱是不可解的。而 Meta 眼鏡獨家使用高通的 AR1 芯片,使得 Meta 眼鏡的續航大為提升——官方表示單次續航約四小時。實測中,如果音樂、攝像功能的使用不頻繁,甚至可以支撐更久。
除此之外,藍牙芯片、攝像頭清晰度、開放式耳機的聲音調教都在近些年取得了不小的進步。
事實上,Meta 最初也并沒有意識到這一代的 Meta 眼鏡能夠在消費者層面上獲取如此大的成功。上一代的 Meta 眼鏡功能相似,卻沒有取得類似的成功。但正是硬體領網域持續不斷的技術積累,推動了 Meta 眼鏡的可用性質的飛躍,終于突破了智能眼鏡佩戴舒适度的臨界紅線,使其成為消費者願意長期佩戴的設備。
硬體性能已足以支持全天候運作,軟體智能已達到純語音互動即可勝任復雜任務的水平。
AI 取代傳統顯示技術,使智能眼鏡成為人機互動第一入口——這條颠覆性的第三路徑,或許已近在咫尺。