今天小編分享的科學經驗:AI在手機裏結出了果,歡迎閲讀。
2023 年初 AI 大模型火爆全球,當時就有人説,這項技術走向大眾的最佳方式就是手機。
不管消費者怎麼想這句話,苦于銷量連年下降的手機廠商們肯定是把它聽進去了。
于是,從 2023 年下半年開始,所有手機新品都在标榜 AI 能力,都宣稱自己是 AI 手機。這場盛宴持續上演到今天,即使是相對保守的蘋果也發布了 "Apple Intelligence",而那些原本被認為已經被擠壓到缺少生存空間的二線手機品牌,也頑強地依靠 "All in AI" 留在了牌桌上。
一時間,AI 在手機市場是鑼鼓喧天,紅旗招展,人山人海……不對,人山人海可能還不一定。
對于用户來説,面對鋪天蓋地的 AI 手機,華美無比的發布會 PPT,可能有點小迷惑:AI 到底能給我帶來什麼?這麼多 AI 手機之間有什麼不同?我設想的 AI 是科幻電影裏那種,手機能給我嗎?
事實上,從 2017 年深度學習火熱起來之後,手機與 AI 的結合一直都在持續。幾年來,我們經歷了端側 AI 算力、AI 攝影、端側大模型,到系統級 AI 能力的變遷。假如手機是一片果園,AI 這棵果樹在裏面已經長了很多年。
那麼,到 2024 年,AI 手機無限風光之時,這顆果子它保熟了嗎?
讓我們穿越紛繁復雜的概念,看看 AI 手機究竟帶來了什麼。
提起 AI 手機,我們總會有一種很空洞的感覺,甚至不知道廠商和專家到底在激動個什麼。
這種虛妄感來源于業界并不存在對 AI 手機的标準化認定。于是每個廠商,甚至每個人都可以對其進行獨立闡釋。這些闡釋有共識,有差異,還有大量似是而非與文字遊戲。這些聲音交織在一起,就變成了一種概念遊戲。
因此,想要了解 AI 手機,首先要避免被概念遊戲幹擾。就像要摘果子,首先要把枝葉撥開。如何實現這種免打擾呢?一個簡單的方法,叫作 "AI 手機,我有三不看 "。
首先,廠商的 "AI 大帽子 " 不用看。
不久之前,AI 手機領網域姗姗來遲地發布了此前承諾的 Apple Intelligence。但這個 " 蘋果智能 " 卻沒有激起多大的市場水花。原因在于,蘋果智能更像是眾多 AI 功能的更新打包,而非某種新能力、新思路。
這種給眾多 AI 小功能起個大名字的玩法,在今天的手機界比較普遍。用户以為得到了新東西,其實不過是新瓶裝舊酒,散裝改零售。類似的説法,經常還包括某某智能、某某 GPT、某某原生,大差不差都是一個意思。甚至很多時候這根本不是一個研發系統主導的項目,而是市場部歸攏收集一下各個部門都有哪些 AI 能力,最後編個名字給寫進 PPT 裏而已。
其次,是缺乏标準的技術名詞不用看。
任何技術在受到重視之後,都會經歷一個造詞階段。這些新造的詞有些會最終留下來,變成約定俗成、相對标準化的説法。但絕大部分都會悄然流逝在歷史記憶裏。在 AI 手機領網域,我們經常會看見大量類似的新詞。它們或多或少都有所指,但作為普通消費者大可不必去探尋每個詞的來龍去脈,也不用被它們迷惑了判斷。
諸如智能框架、意圖識别、主動服務、全局智能等高大上的 AI 手機詞匯,在今天都沒有統一标準,愛好者可以研究研究,大多數消費者不妨敬而遠之。
再次,大模型參數以及其他 AI 參數不用看。
從 2018 年預訓練大模型開始出現,就產生了一種頭部廠商説效果,其他廠商拼參數的現象。在核心能力上很難構建差異化的廠商,往往會宣傳自己模型參數更大,跑分效果更好。這一點來到 AI 手機階段,就變成了宣傳端側大模型的參數大、數量多。但 AI 模型不是 CPU 等硬體,參數高并不意味着性能好。模型效果還取決于壓縮方案、調優效果等一系列條件,所以不必将廠商宣傳的模型參數等同于產品價值。
蒸餾掉這些之後還能留下的東西,才是 AI 在手機裏結出的果。
很多人都在説,AI 沒有應用可怎麼辦。但問題是,ChatGPT 本身就是一種應用。在應用端再誕生更強的超級應用固然前景美好,但大模型本身的應用價值本身就有跟手機結合的空間。
AI 手機的第一步,就是要把類 ChatGPT 的大模型能力帶到手機的第一方功能裏。比如 iOS18.1,重點引入的 AI 功能,就包括 AI 寫作、郵件推薦與回復、消息摘要等。換個角度想想,我們會發現這些都是 ChatGPT 就能做到的事。
這種思路并沒有什麼不好,而且也必須由手機廠商第一方來主導。因為如今智能手機提供的第一方功能非常多,而其中又有大量可以加入語義理解、内容生成等大模型能力的地方。因此,大語言模型與手機第一方功能的點對點結合,是 AI 在手機裏結出最多的果。
對于類似功能的選擇,建議是根據自身需求來挑選實用的功能,或者功能群組。比如去年 11 月,OPPO 就發布了一鍵生成 AI 通話摘要。這個功能可以在通話結束後,智能識别通話内容并生成重點信息摘要。再比如 Find X8 Pro 可以長按電源鍵呼出問屏功能,AI 根據螢幕顯示來回答文章内容、圖片信息等。小米在澎湃 OS 2 當中,也推出了一系列諸如 AI 寫作、AI 識音、AI 妙畫的智能功能。
但對于手機廠商來説,大模型功能的加入顯然只是敲門磚。這種單點更新并不能滿足廠商對 AI 的野心。
于是,智能體來了。
AI Agent 又被稱為智能體,被廣泛認可是真正體現了 AI 思維的新應用形态。智能體可以跨越不同的軟體工作流程,來實現目标主導的自主判斷。這種運行邏輯放在手機裏有兩方面的好處。
對于用户來説,智能體可以被視作獨立于點滑互動的新互動形式。用户可以命令智能體來完成指令,并且其理解能力、生成能力與應用範疇都遠大于此前的語音助手,更加貼近用户對個人助理的基本想象。
對于手機廠商來説,智能體不僅是一個全新賣點,還可以繞過 APP 的藩籬,讓第一方的應用權限更大,體驗更加重要。把智能體做起來,有概率讓用户習慣、第三方應用服務都與廠商綁定更加緊密。
在這樣的驅動力下,幾個月以來手機廠商紛紛在智能體陣地上秣馬厲兵,誓有一種在 2025 年展開智能體決戰的架勢。而從 AI 手機的發展線上看,手機 +AI Agent 是一個脱離了 ChatGPT 基本應用框架,同時蘋果為代表的歐美終端廠商沒有跟進的領網域。中國 AI 手機的未來成就,或許就系在智能體的機遇上。
在智能體方面,目前最為用力地就是榮耀。不久之前的榮耀 Magic7 發布會上,榮耀 CEO 趙明用 YOYO 智能體自動下單了 2000 杯咖啡,一下讓智能體手機的概念大為出圈。目前,榮耀主推的智能體體驗包括 " 一句話關閉自動續費 "" 一句話點咖啡 "" 一句話發送檔案 "" 一句話關閉應用權限 " 等。在手機行業裏相對完整且具體地展現了智能體價值。
在 2024 vivo 開發者大會上,vivo 也亮出了自己的智能體方案 Phone GPT,其不僅具有對螢幕界面的識别和操作功能,還可以接管音頻,通過電話實現預訂餐廳等功能。把智能體延伸到音頻領網域,也成為接下來一個值得關注的方向。
在 OPPO 這邊,則有可以連續多輪自然對話,并可以跨應用操作的 OPPO AI。除了提供識物、導航、問答等 AI 能力外,OPPO AI 還可以與影像能力、AIGC 能力結合,幫助用户完成圖片識别、圖片處理、排版潤色等功能。
在華為這裏,HarmonyOS NEXT 版本具有搭載了盤古大模型的鴻蒙智能助手小藝。其感知和推理能力較此前版本有極大提升,可以實現 23 類主要場景的互動。
這些嘗試,都可以看作是向手機 +AI Agent 方向的前進,只是各個廠商的具體技術實現方式、能力側重以及宣傳話術不同。
對于消費者來説,如果你是深度手機用户,今天可能已經到了嘗鮮智能體的時機,但如果并沒有被傳統互動方式困擾等問題,或許還可以讓智能體手機再成熟一些。
至少 AI Agent 這顆果子,目前看來有着碩大無朋的潛力。
AI 大模型與手機的結合方案有很多,但個人認為,二者的最佳結合點其實是很明确的,那就是無障礙能力。
AI 大模型的核心功能之一,就是在影像、音頻、文字幾種不同的媒介間進行轉換,而這恰好也是視障、聽障人群最為需要的。因此,當有人認為 AI 大模型與手機結合并不必要時,我會説看看無障礙能力的長足進展就能知道,AI 手機必有未來。
通過與很多聽障、視障朋友的交流,以及對相關機構的采訪,發現大家都希望實名表揚華為和 vivo。早些年普遍認為蘋果的無障礙能力很好,但現在已經是華為和 vivo 在引領端側無障礙能力的發展,尤其是 AI 時代的無障礙更新。
比如説,vivo 通過 AI 技術為聽障、視障人群和老年人提供了一系列幫助。去年,vivo 的 " 手語翻譯官 " 軟體獲得了 CCL2024 手語數字人翻譯質量評測第一名。今年,vivo 還更新了 " 手語學習 " 功能,推動手語的教育普及。
鴻蒙系統的發展,每一步都伴随着對端側無障礙事業的大力投入。比如 HarmonyOS 4 就推出了助聽器直連功能。在華為開發者大會 2023 期間,推出了能幫助視障人群識别具體場景與物品的小藝看世界。而在今年,HarmonyOS NEXT 則在業界率先推出了小藝聲音修復功能,它利用 AI 技術對語言障礙者的聲音進行實時分析、修復和優化,不僅能夠發出可懂音,還能盡可能保留用户音色。這個功能專為四級和三級言語障礙人群設計,可以實現無需文本輸入的聲音修復,極大拓展了端側無障礙能力的邊界。
對于很多用户來説,手機裏的 AI 能力或許是錦上添花,但對于有障礙群體來説,AI 手機或許就是改變生活乃至生命的鑰匙。
僅為此,AI 也必須在手機中存在,壯大,盛放。
回顧一下手機廠商推進的 AI 能力,會發現其實每一步都還有很青澀的地方。如果我們願意承認二者結合的復雜性,那麼 AI 手機的果子可能還真不太保熟。
如果手機只提供 AI 能力,那麼廠商會面臨與應用開發者的直接競争。而應用開發者包括互聯網巨頭與專業的 AI 廠商,手機廠商的技術能力與用户号召力可能并不具有説服力。
于是,手機廠商希望押注智能體這樣的突破性體驗,但目前階段這類體驗還有待打磨和更新。很多時候,用户給智能體下達的指令需要反復确認,效率還不如直接點滑,而 AI 接管音頻等能力則不确定性更大。面對經常出錯的,且應用範圍不廣的智能體,用户的耐心與信任或許會快速枯竭。
更為重要的是,這類前沿能力還不足以影響消費者的核心決策。AI 手機大概率會導致手機市場短期向好,但還沒到能夠逆轉持續走低趨勢的程度。
再向上一層則比較務虛。意圖識别、主動服務、服務找人等口号,眾多手機廠商都喊了很多年。但真實情況是,最先進的大模型也無法預測人的想法。消費者對 AI 手機的期待是科幻電影裏全能的個人助理。廠商為了促銷,也會在話術中将 AI 手機進行包裝和誇大,但最終在可見的範圍内,手機行業只能一次次與消費者的預期違背。
頂着這些壓力,AI 手機還在趕路的途中。從技術體驗的角度,它确實還不足以帶來颠覆,但從產業發展的角度,AI 大模型與手機結合是一個絕佳的戰略機遇。海外大模型進不來,谷歌另辟蹊徑,蘋果龜速發展。AI 之于中國手機,多少有了點天命在身的意味。
這是一個前所未有的局面,即使果子還沒熟透。對于大多數消費者,也不妨像《鄉村愛情》裏謝永強經常説的那樣—— " 我得去果園看看 "。