今天小編分享的互聯網經驗:大模型對智能音箱是救命還是“革”命?,歡迎閲讀。
圖片來源 @視覺中國
文 | 新立場 NewPosition
9 月 15 日,有媒體報道稱阿裏巴巴旗下 " 天貓精靈 " 将更名,并且已有 XGENIE 品牌字樣的新品在部分渠道露出。阿裏方面相關負責人的回應是," 确實計劃推出全新品牌,強化精靈屬于用户的個性化特征 "。
" 換号重練 " 的動作背後,是生成式大模型浪潮給已經沉寂的智能音箱行業刮來的一縷新風。
去年國内智能音箱的出貨量僅有 2600 萬台,市場結構呈現出高度的集中化,小度、小愛和天貓精靈三家合計份額超過了 90%。不過頭部這幾家整體的市場份額差距不大,百度是 35%、小米是 31%、天貓精靈則是 27%,三分天下的結果意味着沒有一家邁過 1000 萬台出貨量的門檻。
這個成績放在曾經被視為下一代互聯網關鍵入口的智能音箱賽道上,即便不能説泡沫完全破裂,也是實實在在退了潮。站在今天回頭看,阿裏 2020 年投入 100 億圍繞天貓精靈的戰略布局,性價比大概還趕不上李彥宏當年拿 200 億做糯米。
不過在大模型湧現出更高水平的智能後,智能音箱這個行業似乎有了東山再起的可能。
先是在 2 月 9 日,小度宣布将融合文心一言,打造針對智能設備場景的 AI 模型 " 小度靈機 ",并會将其應用到小度全系產品中。
随後 4 月 11 日的阿裏雲峰會上,天貓精靈也宣布将結合通義千問。兼任阿裏雲 CEO 的張勇表示,未來天貓精靈希望能成為 " 個性化的智能助手 ",并推出了模仿脱口秀演員鳥鳥聲音和性格的 " 鳥鳥分鳥 "。
小米這邊雖然本身在大模型方面的進度比互聯網大廠慢一些,但在上個月也已經開啓了小愛同學的 AI 大模型版本測試。
只是大模型雖然一片熾熱,但智能音箱的前景并沒有看起來那麼光明。
智能音箱是入口,先要智能家居管夠
當 2014 年 Echo 亮相時,其實賣得并不好,起碼在銷量上是如此,最初亞馬遜也只允許 Prime 會員或者受邀用户使用該產品。但在 Echo 推出後不久,包括谷歌和蘋果在内的大廠就決定要做一款類似的產品,因為它們認為智能音箱會成為用户家庭生活的中心,尤其是作為各類智能家居的接口。
這個邏輯後來得到了國内眾多企業的認可,他們相繼推出了自己的智能音箱產品,一時間消費者眼花缭亂。後來劇情走向跟互聯網科技行業的其他細分領網域一樣,百度、小米和阿裏依靠雄厚的資金實力完成了對其他玩家的圍剿,并把 " 三足鼎立 " 的市場格局保持到了今天。
只不過遺憾的是,突出重圍的玩家并沒有勝利果實可分。根據洛圖科技的數據,2022 年國内智能音箱的全渠道銷量只有 2631 萬台,同比下降了 28%。今年上半年,行業萎靡的趨勢得到了保持,同口徑的統計數據是全渠道銷量 1148 萬台,同比下降了 19%;對應的銷售額為 33.7 億元,同比下降了 20%。
對于智能音箱市場的頹勢,一個可能的解釋是它所希望服務的對象群體沒預想的多,消費者對智能家居產品的熱情沒那麼高。
從國内互聯網的發展歷史看,消費互聯網的步伐要比產業互聯網快得多。
當前用户手機上所能看到的所有國民級軟體,在 C 端的用户普及過程都是一條極其陡峭的增長曲線,微信和抖音都是典型的例子。比如,微信是 2011 年上線,到 2016 底的時候其月活就已經接近 9 億,基本等價于全面覆蓋了對應時點中國移動互聯網網民群體。
而相較之下,產業互聯網的節奏要慢得多,即便是動靜最大的雲計算行業也是如此。在最初一批泛互聯網企業實現數字化上雲過後,後續傳統行業的拓客只能靠各大雲廠商龐大的銷售隊伍去艱難推進,以至于所有雲廠商不得不把重心放到 G 端,因為後者是目前最穩定的業務來源。
但在某一個細分領網域,消費互聯網跟產業互聯網的位次卻恰恰相反,那就是智能設備或者説物聯網(IoT)。
有工廠的企業一般都有着較為強勁的動力在車間裏裝上各式各樣的傳感器和機器人,這背後的原因既包括減少人工成本,也是因為這樣做能在生產效率和安全性等方面有大幅提升。
例如,特斯拉成功的一個關鍵支點,就是使用大量自動化設備和軟體系統的超級工廠,馬斯克甚至将自動駕駛理念引入流水線。今天,國内汽車制造行業智能設備的滲透率已經達到了 36.5%。
相較之下,C 端的智能設備,也就是我們通常説的智能家居,在推廣應用上明顯落後。方正證券四月的一份研報裏,引用了 Statista 的數據,給出的當下中國智能家居滲透率僅為 13%。考慮到有眾多的所謂智能家居處于吃灰狀态,實際的利用水平可能比這個數據更低。
之所以呈現出這樣的分化,最根本的原因是工廠裏的智能設備是 " 剛需 ",而家裏的智能設備可能連 " 雞肋 " 都算不上。
以本文關注的智能音箱為例,大部分消費者把這個東西買回家,都是抹掉 " 智能 " 當作 " 音箱 " 在用,比如講講故事聽聽歌之類的。Rakuten Insight 的調查結果就顯示,高達 79% 的擁有智能音箱的國内受訪者表示,他們使用智能音箱主要是為了搜索音樂和播放歌曲。
由于各家此前采用的競争戰略太激進,智能音箱的價格普遍難以覆蓋各個環節的成本。在 " 星辰大海 " 的夢想破滅過後,不得不祭出一些騷操作回血。像天貓精靈前幾年聽一些 APP 的會員歌曲是不用付費的,而如今即便你開通了音樂 APP 的會員,還需要進一步開通天貓精靈的會員才能聽歌。
其他的智能家居設備往往跟智能音箱差别不大,其實也沒有智能到足以在消費者群體裏創造剛需價值。考慮到家用產品普遍經久耐用,如果沒有必要性,消費者采納新產品的時間會拖得比較長。IDC 給的估計是,2022 年全球智能家居設備出貨量将下降 2.6%。(注意不要把這樣的降幅跟智能手機對比,智能手機已經滲透到頂了,但大量的傳統家居設備還沒被替代。)
另一個需要考慮的問題是,智能音箱跟不同品牌的各類智能家居設備的兼容性。阿裏拿出 100 億元人民币,重點就是圍繞天貓精靈打造生态上面。不過由于家電廠商往往傾向于不跟某家科技公司綁定,所以很多產品都支持接入不同品牌的智能音箱,基本的适配一般沒有問題。
大模型是革命,革智能音箱的命
當然,智能音箱過去幾年的命運轉折,顯然不能都歸咎到智能家居市場的整體狀況不夠給力。更主要的原因,仍然是智能音箱本身不夠智能。很多時候跟其他的人工智能產品一樣,智能音響表現出的行為更偏向 " 人工智障 "。
通常用户只能給它下達極其簡單的指令,比如聽歌、看天氣、控制燈光或者給小孩講睡前故事。而一旦語音指令的結構略微復雜,或者涉及多輪交流互動的場景,智能音箱的表現就成了災難現場。
智能音箱的工作涉及三個流程,把用户的語音轉換成文字指令,理解指令的意思并進行處理,然後是将處理的結果轉換成文本輸出。上述三個流程分别對應三種技術,自動語音識别(ASR),自然語言處理(NLP)和文本轉語音(TTS)。
其中,頭尾兩個語音和文本之間相互轉換的環節已經非常成熟,智能音箱的 " 智障 " 根源在中間的自然語言處理。而生成式大模型的出現,使計算機的自然語言處理能力發生了躍進。在一般的場景裏,GPT 表現出來的溝通對話能力已經令一些人開始讨論通用人工智能(AGI)跟我們的距離。
所以,毫無疑問生產式大模型确實能夠大大補足現有智能音箱不夠 " 智能 " 的缺陷。因此如《新立場》在本文開頭提到的,現有的頭部智能音箱大廠都在這方面有動作。而且從時間節點上看,大家都異常興奮和着急。比如百度 2 月 9 号説要在小度裏面集成文心一言的時候,文心一言還不知道在哪呢。
大模型或将給智能音箱帶來變革,這看起來的确是個成立的邏輯。除了各家智能音箱的廠家摩拳擦掌,行業内關注這個方向的媒體也充斥着類似的看法。
然而在《新立場》看來,大模型雖然解決了傳統智能音箱面臨的最大問題,但同時也徹底解構了智能音箱曾經設想的應用場景。
智能音箱從誕生以來,身上貼的最鮮豔的标籤就是 " 入口 ",另一個同樣貼有這個标籤的東西是智能手機。如果大模型最終真的足夠智能,那麼決定智能音箱命運的關鍵,就是在 " 入口 " 這個角色上,它能不能競争得過智能手機。
答案顯而易見,除了外放功率這個指标,所有智能音箱能幹的事,智能手機都能幹。而反過來,智能手機能完成的任務和跟用户的緊密聯系是智能音箱遠遠不及的。筆者了解到的一個場景是,有些用户的家裏會有多個智能音箱,客廳卧室不同區網域各放一個。如果你需要以一種優雅的方式,在家裏的各個地方對智能音箱發出指令,那這就是必須的。
所以,智能音箱跟智能手機相比基本沒有任何差異化優勢。
而在大模型面世後,由于大模型在通用智能上的驚豔,人們顯然會傾向于把大模型當作真正的個人助手或者夥伴,然後再通過它來解決盡可能多的問題。這種情況下,智能音箱的角色會被加速歸并到智能手機的個人助手,因為那才是真正不可替代的入口。
歸根結底,如果大家都是 " 人工智障 ",用户的使用需求不大,那我還不會那麼快取代你;而如果有了真正的人工智能,用户的需求上來了,那他既會用這個人工智能助手幫忙寫 PPT、查資料,也會跟他做溝通交流尋求情感安慰,當然也會用它控制家裏的冰箱、空調、電燈泡,而不是單單局限于某個具體的場景。
寫在最後
一個有趣的事實是,在推出 Echo 之前,其實亞馬遜有個優先級更高的智能手機項目 Fire Phone。如果不是智能手機項目的失敗,亞馬遜後來會不會推出 Echo 這個產品都需要打個問号。
在差不多十年時間過去後,智能音箱這個行業已經經歷了一輪完整的興衰。在生產式大模型爆發前,這個行業仍然存在的最大原因并不是用户需要,因為如果用户需要的東西,他們會願意花公允價錢去買,而不是得廠家半賣半送。
在智能音箱這個行業眼看着要随着慣性逐漸湮沒的時候,大模型來了。 但它不是強心劑,而是催命符。 智能音箱一開始就多餘,大模型來了就更多餘。