AI在手機裏結出了果

今天小編分享的科學經驗：AI在手機裏結出了果，歡迎閲讀。

2023 年初 AI 大模型火爆全球，當時就有人説，這項技術走向大眾的最佳方式就是手機。

不管消費者怎麼想這句話，苦于銷量連年下降的手機廠商們肯定是把它聽進去了。

于是，從 2023 年下半年開始，所有手機新品都在标榜 AI 能力，都宣稱自己是 AI 手機。這場盛宴持續上演到今天，即使是相對保守的蘋果也發布了 "Apple Intelligence"，而那些原本被認為已經被擠壓到缺少生存空間的二線手機品牌，也頑強地依靠 "All in AI" 留在了牌桌上。

一時間，AI 在手機市場是鑼鼓喧天，紅旗招展，人山人海……不對，人山人海可能還不一定。

對于用户來説，面對鋪天蓋地的 AI 手機，華美無比的發布會 PPT，可能有點小迷惑：AI 到底能給我帶來什麼？這麼多 AI 手機之間有什麼不同？我設想的 AI 是科幻電影裏那種，手機能給我嗎？

事實上，從 2017 年深度學習火熱起來之後，手機與 AI 的結合一直都在持續。幾年來，我們經歷了端側 AI 算力、AI 攝影、端側大模型，到系統級 AI 能力的變遷。假如手機是一片果園，AI 這棵果樹在裏面已經長了很多年。

那麼，到 2024 年，AI 手機無限風光之時，這顆果子它保熟了嗎？

讓我們穿越紛繁復雜的概念，看看 AI 手機究竟帶來了什麼。

提起 AI 手機，我們總會有一種很空洞的感覺，甚至不知道廠商和專家到底在激動個什麼。

這種虛妄感來源于業界并不存在對 AI 手機的标準化認定。于是每個廠商，甚至每個人都可以對其進行獨立闡釋。這些闡釋有共識，有差異，還有大量似是而非與文字遊戲。這些聲音交織在一起，就變成了一種概念遊戲。

因此，想要了解 AI 手機，首先要避免被概念遊戲幹擾。就像要摘果子，首先要把枝葉撥開。如何實現這種免打擾呢？一個簡單的方法，叫作 "AI 手機，我有三不看 "。

首先，廠商的 "AI 大帽子 " 不用看。

不久之前，AI 手機領網域姗姗來遲地發布了此前承諾的 Apple Intelligence。但這個 " 蘋果智能 " 卻沒有激起多大的市場水花。原因在于，蘋果智能更像是眾多 AI 功能的更新打包，而非某種新能力、新思路。

這種給眾多 AI 小功能起個大名字的玩法，在今天的手機界比較普遍。用户以為得到了新東西，其實不過是新瓶裝舊酒，散裝改零售。類似的説法，經常還包括某某智能、某某 GPT、某某原生，大差不差都是一個意思。甚至很多時候這根本不是一個研發系統主導的項目，而是市場部歸攏收集一下各個部門都有哪些 AI 能力，最後編個名字給寫進 PPT 裏而已。

其次，是缺乏标準的技術名詞不用看。

任何技術在受到重視之後，都會經歷一個造詞階段。這些新造的詞有些會最終留下來，變成約定俗成、相對标準化的説法。但絕大部分都會悄然流逝在歷史記憶裏。在 AI 手機領網域，我們經常會看見大量類似的新詞。它們或多或少都有所指，但作為普通消費者大可不必去探尋每個詞的來龍去脈，也不用被它們迷惑了判斷。

諸如智能框架、意圖識别、主動服務、全局智能等高大上的 AI 手機詞匯，在今天都沒有統一标準，愛好者可以研究研究，大多數消費者不妨敬而遠之。

再次，大模型參數以及其他 AI 參數不用看。

從 2018 年預訓練大模型開始出現，就產生了一種頭部廠商説效果，其他廠商拼參數的現象。在核心能力上很難構建差異化的廠商，往往會宣傳自己模型參數更大，跑分效果更好。這一點來到 AI 手機階段，就變成了宣傳端側大模型的參數大、數量多。但 AI 模型不是 CPU 等硬體，參數高并不意味着性能好。模型效果還取決于壓縮方案、調優效果等一系列條件，所以不必将廠商宣傳的模型參數等同于產品價值。

蒸餾掉這些之後還能留下的東西，才是 AI 在手機裏結出的果。

很多人都在説，AI 沒有應用可怎麼辦。但問題是，ChatGPT 本身就是一種應用。在應用端再誕生更強的超級應用固然前景美好，但大模型本身的應用價值本身就有跟手機結合的空間。

AI 手機的第一步，就是要把類 ChatGPT 的大模型能力帶到手機的第一方功能裏。比如 iOS18.1，重點引入的 AI 功能，就包括 AI 寫作、郵件推薦與回復、消息摘要等。換個角度想想，我們會發現這些都是 ChatGPT 就能做到的事。

這種思路并沒有什麼不好，而且也必須由手機廠商第一方來主導。因為如今智能手機提供的第一方功能非常多，而其中又有大量可以加入語義理解、内容生成等大模型能力的地方。因此，大語言模型與手機第一方功能的點對點結合，是 AI 在手機裏結出最多的果。

對于類似功能的選擇，建議是根據自身需求來挑選實用的功能，或者功能群組。比如去年 11 月，OPPO 就發布了一鍵生成 AI 通話摘要。這個功能可以在通話結束後，智能識别通話内容并生成重點信息摘要。再比如 Find X8 Pro 可以長按電源鍵呼出問屏功能，AI 根據螢幕顯示來回答文章内容、圖片信息等。小米在澎湃 OS 2 當中，也推出了一系列諸如 AI 寫作、AI 識音、AI 妙畫的智能功能。

但對于手機廠商來説，大模型功能的加入顯然只是敲門磚。這種單點更新并不能滿足廠商對 AI 的野心。

于是，智能體來了。

AI Agent 又被稱為智能體，被廣泛認可是真正體現了 AI 思維的新應用形态。智能體可以跨越不同的軟體工作流程，來實現目标主導的自主判斷。這種運行邏輯放在手機裏有兩方面的好處。

對于用户來説，智能體可以被視作獨立于點滑互動的新互動形式。用户可以命令智能體來完成指令，并且其理解能力、生成能力與應用範疇都遠大于此前的語音助手，更加貼近用户對個人助理的基本想象。

對于手機廠商來説，智能體不僅是一個全新賣點，還可以繞過 APP 的藩籬，讓第一方的應用權限更大，體驗更加重要。把智能體做起來，有概率讓用户習慣、第三方應用服務都與廠商綁定更加緊密。

在這樣的驅動力下，幾個月以來手機廠商紛紛在智能體陣地上秣馬厲兵，誓有一種在 2025 年展開智能體決戰的架勢。而從 AI 手機的發展線上看，手機 +AI Agent 是一個脱離了 ChatGPT 基本應用框架，同時蘋果為代表的歐美終端廠商沒有跟進的領網域。中國 AI 手機的未來成就，或許就系在智能體的機遇上。

在智能體方面，目前最為用力地就是榮耀。不久之前的榮耀 Magic7 發布會上，榮耀 CEO 趙明用 YOYO 智能體自動下單了 2000 杯咖啡，一下讓智能體手機的概念大為出圈。目前，榮耀主推的智能體體驗包括 " 一句話關閉自動續費 "" 一句話點咖啡 "" 一句話發送檔案 "" 一句話關閉應用權限 " 等。在手機行業裏相對完整且具體地展現了智能體價值。

在 2024 vivo 開發者大會上，vivo 也亮出了自己的智能體方案 Phone GPT，其不僅具有對螢幕界面的識别和操作功能，還可以接管音頻，通過電話實現預訂餐廳等功能。把智能體延伸到音頻領網域，也成為接下來一個值得關注的方向。

在 OPPO 這邊，則有可以連續多輪自然對話，并可以跨應用操作的 OPPO AI。除了提供識物、導航、問答等 AI 能力外，OPPO AI 還可以與影像能力、AIGC 能力結合，幫助用户完成圖片識别、圖片處理、排版潤色等功能。

在華為這裏，HarmonyOS NEXT 版本具有搭載了盤古大模型的鴻蒙智能助手小藝。其感知和推理能力較此前版本有極大提升，可以實現 23 類主要場景的互動。

這些嘗試，都可以看作是向手機 +AI Agent 方向的前進，只是各個廠商的具體技術實現方式、能力側重以及宣傳話術不同。

對于消費者來説，如果你是深度手機用户，今天可能已經到了嘗鮮智能體的時機，但如果并沒有被傳統互動方式困擾等問題，或許還可以讓智能體手機再成熟一些。

至少 AI Agent 這顆果子，目前看來有着碩大無朋的潛力。

AI 大模型與手機的結合方案有很多，但個人認為，二者的最佳結合點其實是很明确的，那就是無障礙能力。

AI 大模型的核心功能之一，就是在影像、音頻、文字幾種不同的媒介間進行轉換，而這恰好也是視障、聽障人群最為需要的。因此，當有人認為 AI 大模型與手機結合并不必要時，我會説看看無障礙能力的長足進展就能知道，AI 手機必有未來。

通過與很多聽障、視障朋友的交流，以及對相關機構的采訪，發現大家都希望實名表揚華為和 vivo。早些年普遍認為蘋果的無障礙能力很好，但現在已經是華為和 vivo 在引領端側無障礙能力的發展，尤其是 AI 時代的無障礙更新。

比如説，vivo 通過 AI 技術為聽障、視障人群和老年人提供了一系列幫助。去年，vivo 的 " 手語翻譯官 " 軟體獲得了 CCL2024 手語數字人翻譯質量評測第一名。今年，vivo 還更新了 " 手語學習 " 功能，推動手語的教育普及。

鴻蒙系統的發展，每一步都伴随着對端側無障礙事業的大力投入。比如 HarmonyOS 4 就推出了助聽器直連功能。在華為開發者大會 2023 期間，推出了能幫助視障人群識别具體場景與物品的小藝看世界。而在今年，HarmonyOS NEXT 則在業界率先推出了小藝聲音修復功能，它利用 AI 技術對語言障礙者的聲音進行實時分析、修復和優化，不僅能夠發出可懂音，還能盡可能保留用户音色。這個功能專為四級和三級言語障礙人群設計，可以實現無需文本輸入的聲音修復，極大拓展了端側無障礙能力的邊界。

對于很多用户來説，手機裏的 AI 能力或許是錦上添花，但對于有障礙群體來説，AI 手機或許就是改變生活乃至生命的鑰匙。

僅為此，AI 也必須在手機中存在，壯大，盛放。

回顧一下手機廠商推進的 AI 能力，會發現其實每一步都還有很青澀的地方。如果我們願意承認二者結合的復雜性，那麼 AI 手機的果子可能還真不太保熟。

如果手機只提供 AI 能力，那麼廠商會面臨與應用開發者的直接競争。而應用開發者包括互聯網巨頭與專業的 AI 廠商，手機廠商的技術能力與用户号召力可能并不具有説服力。

于是，手機廠商希望押注智能體這樣的突破性體驗，但目前階段這類體驗還有待打磨和更新。很多時候，用户給智能體下達的指令需要反復确認，效率還不如直接點滑，而 AI 接管音頻等能力則不确定性更大。面對經常出錯的，且應用範圍不廣的智能體，用户的耐心與信任或許會快速枯竭。

更為重要的是，這類前沿能力還不足以影響消費者的核心決策。AI 手機大概率會導致手機市場短期向好，但還沒到能夠逆轉持續走低趨勢的程度。

再向上一層則比較務虛。意圖識别、主動服務、服務找人等口号，眾多手機廠商都喊了很多年。但真實情況是，最先進的大模型也無法預測人的想法。消費者對 AI 手機的期待是科幻電影裏全能的個人助理。廠商為了促銷，也會在話術中将 AI 手機進行包裝和誇大，但最終在可見的範圍内，手機行業只能一次次與消費者的預期違背。

頂着這些壓力，AI 手機還在趕路的途中。從技術體驗的角度，它确實還不足以帶來颠覆，但從產業發展的角度，AI 大模型與手機結合是一個絕佳的戰略機遇。海外大模型進不來，谷歌另辟蹊徑，蘋果龜速發展。AI 之于中國手機，多少有了點天命在身的意味。

這是一個前所未有的局面，即使果子還沒熟透。對于大多數消費者，也不妨像《鄉村愛情》裏謝永強經常説的那樣—— " 我得去果園看看 "。