今天小編分享的互聯網經驗:端側AI,大模型的新戰場?,歡迎閱讀。
出品 | 虎嗅科技組
頭圖 | 視覺中國
有種觀點認為,如今的智能手機已經成為人類的外部器官。但一個容易被忽視的事實是,這個器官在過去 10 年幾乎沒有任何革命性的進步。
10 年前,全球智能手機市場出貨量達到 10.042 億部,同比暴漲 38.4%。盛極而衰,那一年也成為了智能手機行業最後的輝煌,自此之後,市場增長開始逐漸放緩,直到完全失去增量。
最後一次回光返照—— 5G 換機潮後的市場疲軟,足以說明移動互聯網的紅利,其實早就被終端廠商和應用廠商消耗殆盡。
然而,有些事情正在這個行将就木的行業中悄然發生。
去年 10 月,高通發布全新骁龍 8Gen3 處理器,并重點強調了這枚芯片在 AI 方面上的能力:支持終端側運行 100 億參數的模型,面向 70 億參數大語言模型每秒生成 20 個 token;用時不到一秒就可以在終端側通過 Stable Diffusion 生成圖片。
芯片廠商提供了基礎能力,終端廠商也随即開啟 " 你方唱罷我登場 " 的模式,在短短一個月内,幾乎所有的手機廠商都宣布已經在端側跑通了自研的大語言模型。
同一時期,更加 " 古老 " 的 PC 行業也沒有閒下。年初,在英特爾酷睿 Ultra 處理器後,包括聯想、華碩、惠普、戴爾在内的多家廠商,都拿出了自己的 "AIPC" 方案。
暫且不論 "AI 手機 "、"AIPC" 在功能實現上如何,一個需要被前置讨論的問題是:端側 AI 存在的意義是什麼?
目前最集中的觀點是,端側 AI 在效率和安全性上有着不可替代的優勢。
安全性自然不必多說,在用戶數據無需上傳至雲端的情況下,隐私安全的确能從根本上得到保障。在效率方面,PC 行業的領軍企業聯想主張在端側混合使用 CPU、GPU 和 NPU,搭建異構計算架構,能夠使計算效率達到最高。
而相較于聯想的 " 大包大攬 ",也有體量稍小的手機廠商提出了更加前衛的方案。
魅族認為,手機廠商缺少做大模型的基因,一味地拼參數沒有意義。他們更傾向于打造一個完全開放的平台,供大模型平台使用,包括但不局限于向開發者提供系統權限、API 文檔,并開放處理器的 AI 算力,讓開發者擁有充分的自由度,從而實現更多創新功能和應用服務的制作。
除以上的技術路徑外,大模型在端側還有哪些表現形式?目前端側 AI 還有哪些前沿進展?未來端側 AI 還有哪些商業機遇?
2024 年 1 月 27 日,虎嗅前沿科技組特邀行業技術專家與創業者,共同讨論端側 AI 領網域的商業實踐、技術實踐、創投機會、探索方向。
活動概況:
活動名稱:2024 AI 内參會
活動時間:2024 年 3 月 31 日,14:00-17:00
活動地點:北京 · 虎嗅二層(萬科時代中心 · 十裡)
歡迎掃描海報中的二維碼報名,我們一起讨論端側 AI 的無限可能!
>