今天小編分享的互聯網經驗:大模型能成為手機廠商的救命稻草嗎?,歡迎閱讀。
圖片來源 @視覺中國
文 | 矽基研究室,作者 | 白嘉嘉
把大模型裝進手機,成為了今年手機廠商最愛講的故事。
華為、小米、OPPO、vivo、蘋果都寫起了大模型「上機」的同題作文。其中率先落地的華為智能助手小藝,無需用戶準确說出功能名,憑直覺表達需求,小藝就能理解并執行。部分行業人士認為,手機市場格局會被重構,能夠更成熟應用大模型的品牌将會占據上風。
但同時,市場上也存在許多質疑的聲音,認為這不過是一種營銷概念,将基于 AI 芯片的終端運算偷換成了大模型的熱點概念。另一部分人則斷言,當下的手機硬體,根本不可能在保證電池壽命、手機續航的前提下運行大模型。
手機大模型,究竟是噱頭還是科技變革?
大模型上機的岔路口:雲端 Or 終端?
雖然都是大模型「上機」的同題作文,但手機廠商們還是寫出了不同的風格,其中最大的差異,是将雲端大模型接入手機,還是将大模型部署在手機端。
從進度來看,華為毫無疑問是跑得最快的那個。
從 8 月初華為發布鴻蒙 4.0,首次公開透露将得到大模型加持,到 8 月末得到盤古大模型加持智能助手小藝開啟眾測招募,再到 9 月 15 日悄悄上線 Mate 60 系列手機,接入了盤古人工智能大模型。一個多月時間,華為就兌現了承諾。
據報道,小藝背後的大模型是在華為盤古 L0 基座大模型的基礎上,針對終端消費者場景構建了大量的場景數據與精調模型後的 L1 層對話模型。
基于盤古的自然語言大模型、視覺大模型以及多模态大模型,小藝在互動、生產力提升和個性化服務三個方向上增強,并實現了接口調用與用戶意圖的匹配。
什麼叫接口調用與用戶意圖的匹配?
打個比方,你要讓秘書幫你拿一份檔案。過去的人工智能你得告訴它檔案放在哪個房間的哪個櫃子的哪個抽屜裡,而現在你只需要告訴它需要拿哪份檔案就可以。
也就是說,用戶無需準确說出功能名,憑直覺表達需求,小藝就能理解并啟用相應的功能。
技術路線上,華為的大模型上機有兩個點比較值得留意。
值得留意的第一點是,據市場消息,小藝的語言能力是基于自然語言處理(NLP),而非大語言模型(LLM)。
NLP 和 LLM 是互相關聯的兩個概念,按學術上的定義,LLM 是 NLP 的一個分支,它們的目标都是讓計算機理解和處理人類語言。
之所以說這一點值得留意,主要是因為華為本身并不僅僅是一家手機廠商,而是一家跨通信、手機、企業服務多領網域的綜合性企業。這種綜合性意味着華為對基礎大模型的迭代有更強的需求,因為基礎大模型的能力越突出,精調出符合要求的行業、垂類大模型的成本就越低,子類大模型的性能也越好。
某種程度上,将大模型接入手機端,只是華為用「大模型賦能千行百業」過程中一個相對特殊的側面,真正決定未來企業前路的,仍是背後的基礎大模型。
從這個角度來看,和華為站在同一維度展開競争的,其實是谷歌。
今年 5 月的 Google I/O 開發者大會上,谷歌發布了 Pixel 手機。作為最大的雲服務商之一,谷歌在人工智能領網域也有着豐富的積累,已經推出了 Bard 插件,日前宣布正式接入 Gmail、Docs、谷歌地圖、YouTube 等應用,多模态大模型 Gemini 正在醞釀當中。
國内的雲服務廠商中,百度也朝手機領網域抛出了探測器,于今年 5 月推出了小度青禾學習手機,搭載文心大模型。
華為值得留意的第二點,也是以上這些玩家的共通點,均是「接入」了大模型,而并非在手機端獨立運行。
其實,部署在雲端還是在終端,一直是大模型上機過程中的一個有争議的部分,兩種方式各有優劣。
雲端的缺點顯而易見,大模型上機是需要互聯網作為支撐的,一旦斷網就會變回原先的「人工智障」。而終端部署的後果是,大模型運算需要更高端的硬體作為支撐,手機價格水漲船高。
不過對小米來說,終端部署大模型所帶來的硬體成本上升,恰好能為高端化戰略提供支撐。
今年 8 月 14 日,雷軍在年度演講中透露,小米最新一個 13 億參數大模型已經成功在手機本地跑通,部分場景可以媲美 60 億參數模型在雲端的運行結果。從名稱推斷,小米 MiLM-1.3B 是大語言模型(LLM)。
雖然小米并非雲服務商,但雷軍的野心顯然也不僅限于手機。盡管沒有完全透露他的答案,不過,小米月活用戶數超過 1.1 億的語音體系小愛同學大概率會是小米未來的主陣地之一。雷軍表示,目前已經更新小愛同學的大模型版本,正開啟邀請測試。
而這揭露出了雷軍選擇終端部署的另一個原因。對手機來說,聯網是硬需求。但對智能音箱等小米生态產品來說,如果能在斷網的情況下實現高質量對話等功能,就能與同類產品拉開差距。
除此之外,OPPO、vivo、蘋果也披露了研發大模型的進度,但最終成果如何,還需日後驗證。
大模型上機不是簡單的組裝
這兩年,大多數手機廠商都在思考同一個問題,怎麼說服消費者換手機?
發展至今,手機已經在之前的技術框架下基本被開發到了極致,再怎麼卷硬體,也很難讓消費者眼前一亮,更别提萌生換手機的念頭了。
Counterpoint 公布的數據顯示,2023 年第二季度,全球智能手機銷量同比下降 8%,環比下降 5%。這已經是全球智能手機市場連續第八個季度處于下滑通道。
而橫空出世的大模型,毫無疑問是今年甚至未來相當長的一段時間内最新鮮的科技故事。
雖然手機市場上還未顯露出端倪,但大模型對終端產品的銷量帶動作用已經得到了驗證。科大訊飛 CEO 劉慶峰透露,接入星火大模型後,訊飛學習機 5、6 月份銷量均實現三位數增長。
在手機廠商看來,這無異是一根救命稻草。
全聯并購公會信用管理委員會專家安光勇認為,手機裝入大模型是為了追趕新的潮流、彌補手機市場缺陷,手機市場目前已相對穩定,消費者對于傳統的手機參數和產品形态已經有了一定的 " 飽和感 "。大模型的出現為手機廠商提供了一種全新的賣點和市場差異化策略。
對銷量的帶動作用值得期待,但大模型引起的變化遠不止已于此,甚至有部分業内人士認為,手機市場的格局将會被大模型重構。
大模型真的能有這麼大的威力嗎?
至少從以下兩個方面來看,是的。
首先,大模型上機看似是技術門檻,實際是對企業判斷、決策能力的考驗。
手機廠商在大模型上的博弈,并不只是簡單的組裝,背後是對廠商技術及軟體等多能力的考驗。底層系統上的融合,算法的分配和優化,功耗的控制,對 " 智能 " 的理解差異,這些都會讓廠商在體驗上拉開差距。
比如,第一部分提到的大模型廠商在「雲端接入」和「終端部署」之間的分歧,本質上就是對功耗的控制上的分歧。
雖然運行在手機端的大模型參數量并不像雲端大模型那樣來到千億數量級,但對手機硬體來說仍是不小的負擔,可能導致手機發燙、電池壽命縮短、續航能力下降。
其次,大模型越用越「貼心」的屬性可能會改變大眾在選購手機及相關智能終端時的消費心理,繼而帶來更高的品牌忠誠度。
眾所周知,大模型的質量與數據、訓練量高度相關。這也意味着,一旦購入某個品牌搭載了大模型的手機後,每次呼喚大模型并要求他執行指令,都可以視為完成了一次訓練,機主和手機之間會越來越「默契」。
因此,未來當消費者更換手機或購買新的智能產品時,可能會面臨一個新選擇:選擇和一個新的「人工智能」重新開始,還是數據、模型互通的同品牌手機繼續使用?
大模型不是手機廠商的殺手锏
對手機廠商來說,大模型是一道必選題,不論最後能獲得怎樣的分數,放棄作答肯定都不是明智之選。
但站在消費者的立場上,大模型「上機」,仍有許多疑慮有待解答。
第一個問題在前文其實已經鋪墊了許多,比如大模型上機帶來的硬體負擔,模型參數較小,雲端和終端的分歧,這些内容傳遞出的信息是,至少在設備層面上,大模型上機仍不成熟。
那麼,大模型上機究竟是不是噱頭?
客觀來說,這個問題的答案取決于我們如何定義噱頭。
如果将标準定在手機能不能運行大模型,其實,早在今年 5 月,大模型就已經在手機上跑起來過了。
彼時,科技圈大佬陳天奇和他帶領的 CMU 機器學習編譯小組(MLC),開源發布了一個叫 MLC-LLM 的通用解決方案。通過這個方案,任何語言模型都被允許部署在各種硬體後端和本機應用程式上,并為每個人提供一個高效的框架,以進一步優化自己用例的模型性能。
方案發布後,極客們紛紛跟進,并在社交平台上曬出了在「飛行模式」下運行大模型的效果,收獲了一片「Amazing~」。
陳天奇和極客們與各大手機廠商無利益相關,他們的實際體驗證明,手機芯片足以支撐大模型的運轉。
但如果将标準提高一些,以能否成為一個輔助工作的智能助手來衡量大模型「上機」,答案可能是令人失望的。
本輪大模型熱的技術原點,是 OpenAI 将模型參數提升到了千億級别後,出現了許多意想不到的能力,但這種規模的大模型運轉的成本非常高,遠非手機所能支撐。
因此,想将大模型裝進手機,需要通過剪枝、蒸餾、量化等手段縮小模型規模。這也意味着,手機端大模型不可能像 ChatGPT 或文心一言等雲端大模型那麼智能,能力範圍大幅縮窄。
從這個角度來看,「雲端接入」或許是「水分」更少的做法。
不過,即便采用雲端接入的做法,可能也很難做到令消費者滿意的程度。
目前的大模型研究仍未解決的一個關鍵問題是「幻覺」,簡單來說,「幻覺」的存在會讓大模型一本正經的胡說八道。 許多 Chatbot 的使用者都曾被它誠懇的語句所迷惑,導致輕信了它漏洞百出的答案。
這種隐蔽的錯誤是工作中的定時炸彈。試想,你要求大模型幫你搜集整理資料,并用它憑空捏造的結論來推進事務,會產生多麼嚴重的後果。
此外,「雲端接入」給消費者帶來的另一個問題是信息安全。
24 小時手機不離身是當代人的常态,它深度參與我們的工作與生活。因此,當它具備一定程度的智能,有權限調取我們的信息并反饋至雲端進行演算後,信息洩露的風險也随之而來。
這并非是杞人憂天。今年 4 月,三星就因為啟用 ChatGPT 在 20 天内出現 3 起數據洩漏事故,導致其與半導體設備測量、良品率 / 缺陷、内部會議内容等關鍵信息被上傳到 ChatGPT 的伺服器中。
而這也是小米選擇通過終端部署的方式實現大模型上機的原因,雖然硬體上困難重重,但僅在本地運行的模式,卻能在最大程度上解決信息洩露的問題。
整體來說,手機廠商的大模型上機不是空頭支票,但也沒有他們所描繪的那麼美好。将大模型看作殺手锏,既高估了大模型的能力,也低估了真正落地用戶端所面臨的難題。