今天小編分享的互聯網經驗:人均年薪100萬,手機廠商數百億開卷大模型,歡迎閱讀。
圖片來源 @視覺中國
钛媒體注:本文來源于微信公眾号中國企業家雜志(ID:iceo-com-cn),作者 | 趙東山,編輯 | 李薇,钛媒體經授權發布。
人均年薪 100 萬,什麼樣的行業具備如此優渥的待遇?
答案是 AI 大模型。這是 vivo 副總裁周圍接受《中國企業家》等媒體采訪時給出的答案,他表示,"vivo 大模型現在每年 20 億 ~30 億元的投入成本,總投入成本已經超過 200 億元,人才和數據算力各占一半,人才成本平均每人稅後 100 萬元。"
過去一年,AI 大模型席卷整個互聯網科技行業,當大模型完成從 0 到 1 的基礎建設後,基于不同場景的大模型應用正在成為新一輪的競争點,而擁有龐大用戶基數的智能手機廠商成為最早一批端側大模型的搶灘者。
從 2023 年 8 月起,國内頭部智能手機廠商華為、小米、vivo、OPPO、榮耀相繼公布了大模型研發和落地計劃。
今年 8 月,華為鴻蒙 OS 4 率先宣布接入盤古大模型;小米緊随其後,目前已訓練出 13 億和 60 億參數規模的語言大模型,并在小米澎湃 OS 系統和人工智能助手小愛同學的部分場景已經得到應用。
到了 11 月,手機廠商的大模型發布節奏越發密集。11 月初,vivo 一口氣發布十億、百億、千億級别三個參數量級的五個大模型矩陣;随後,OPPO 正式推出自主訓練的安第斯大模型(AndesGPT),并接入最新作業系統 ColorOS 14,AndesGPT 支持從十億至千億多種不同參數規模模型。
手機廠商入場的心态絕不只是 " 重在參與 ",而是真金白銀地大規模投入。今年 4 月,小米組建大模型團隊時,雷軍就表明态度:" 全力支持,投入不設上限。" 目前,小米内部在做 AI 相關的研發人員超過 3000 人;向來低調的 vivo 創始人、總裁兼 CEO 沈炜也向團隊表示," 未來,AI 将成為科技創新的底層技術。我們必須抓住這次歷史機遇,以高規格地投入,來打造引領行業的技術和產品,為智能時代的到來做出我們的歷史貢獻。"
毫無疑問,在智能手機出貨量下滑,用戶換機周期不斷延長,同質化競争嚴重的當下,端側大模型正在成為手機行業創新的新增量。但與此同時,如何将參數十億、百億的大模型内置到手掌大小的手機中,以及能為手機企業帶來哪些實質變化,也面臨着重重考驗。
挑戰
手機企業要想真正将大模型内置到巴掌大小的手機中,其中就有個悖論:如果模型參數太大了,則手機端側根本就放不進去或跑不起來;但是如果模型太小了,可能又無法真正實現智能湧現。
端側大模型在落地執行中,一個無法忽視的現實是,10 億參數的數據在手機上會占用 1G 的内存,70 億參數的數據則會占用 4G 内存,而當數據量達到 130 億參數時,内存占用達到 7G。然而,現在市面上絕大多數高端手機的運行内存是 12G 或 16G,如果大模型的數據量達到 130 億參數則意味着會占用掉 7G 的内存,這将嚴重影響手機的運行流暢度。
但相比雲上大模型,端側大模型的優勢又顯而易見,比如可以充分保護用戶的隐私,在用戶使用過程中,用戶和大模型的互動數據不用上傳到雲端。與此同時,端側大模型的響應速度會更快,一種最極端的情況就是即便在沒有網絡的情況下,端側大模型依然可以使用,而雲上大模型在沒有網絡情況下則無法使用。
此外,雲上大模型的調用成本高昂。" 一次大模型雲端計算的最低成本是 1.2~1.5 分人民币,若 3 億用戶每天用十次,意味着手機廠商一年要多出 100 多億元的支出。"一位 AI 大模型從業者告訴《中國企業家》。
因此,在現有的模型訓練水平基礎上,擺在手機廠商面前的是人才和技術積累的挑戰,只有聚集到核心的技術人才,才能更好地解決這一困境,手機大模型之戰也在某種程度上意味着是人才和資金投入之戰。
周圍告訴《中國企業家》,自 2017 年組建 AI 全球研究院,vivo 已經組建了 1000 人以上的 AI 專家團隊,每年在人工智能上的投入保守估計在 20 億 ~30 億元,目前已經超過 200 億元,其中,數據、算力成本占自研大模型投入的一半,人員成本占了一半。
小米在人工智能上的布局同樣比較早,2016 年 AlphaGo 出來之後,雷軍就開始大力投入 AI,最開始是視覺團隊,後來逐漸拓展到 AI 的各個領網域。
" 小米有 3000 多人在做 AI 相關的研發工作,小米 AI 實驗室在視覺、聲學語音、NLP、知識圖譜、機器學習等方向,都有技術積累,從算法預研到工程落地具備很強的閉環能力。我們之前有一個人機對話團隊,做過 28 億參數的對話模型。" 小米集團 AI 實驗室主任、自然語言處理(NLP)首席科學家王斌表示。
除了手機廠商在努力布局大模型之外,智能手機的上遊芯片制造商也正在加入這場戰争。
2023 年 10 月 25 日,高通發布新一代移動處理平台骁龍 8 Gen3。與上一代產品骁龍 8 Gen2 相比,骁龍 8 Gen3 不僅 GPU、NPU 性能大幅提升,更重要的是,它可以在終端側運行 100 億參數的模型。
高通着重在骁龍 8 Gen3 上提升了其芯片的 AI 計算能力,NPU 性能大漲 98% 以上,在支持運行最高 100 億參數的模型外,還能夠運行每秒生成高達 20 個 token ( 大模型中文本的最小部門 ) 的 70 億參數大語言模型。這意味着,各類虛拟助手、GPT 聊天機器人未來都能在手機等終端運行。
落地
《中國企業家》觀察發現,幾乎所有的智能手機廠商在布局大模型時都采用了漸進式開發的路線,即先研發和訓練小參數規模的模型,等到把路上的坑都蹚一遍,再研發更大參數規模的模型。
關于不同級别模型的能力表現,周圍告訴《中國企業家》:" 據内部測試,70 億參數的大模型足夠做好簡單的文檔摘要和拆解的功能,但要想真正實現‘智能湧現’, 70 億參數的大模型任務拆解能力還有提升空間,130 億參數可能是更好的選擇。"
除了漸進式開發外,截至目前,智能手機廠商布局大模型也分為兩條路徑:第一,采用輕量化和本地化部署的手機端側大模型,典型廠商如小米和榮耀;第二,采用雲、端協同的架構設計,推出一個大模型矩陣,在雲端部署百億、千億級别的大模型訓練模型,在手機端側部署十億級别的大模型,典型廠商如華為、vivo 和 OPPO。
2023 年 4 月,王斌牽頭負責,小米技術委員會 AI 實驗室大模型團隊負責人栾劍帶隊,小米内部正式成立了一支自研大模型團隊,雷軍親自推動了自研大模型團隊的建立,并全程高度參與了小米大模型的自研,他會親自查看團隊的周報、月報甚至日報,關注大模型進展。
小米自研的端側大模型,更強調跟產品的結合和場景的驅動。" 小米大模型技術的主力突破方向為輕量化、本地部署,我們不會純從技術角度考慮,也不會以比賽為目标。我們不搞軍備競賽,小米做大模型的出發點并不是成為中國的 OpenAI。我們一開始就考慮大模型跟公司的場景怎麼結合。" 王斌告訴《中國企業家》。
與小米主要布局端側大模型不同,華為、vivo、OPPO 自研大模型則采用 " 雲、端協同 " 路徑,華為的盤古大模型、vivo 的藍心大模型以及 OPPO 的安第斯大模型,均覆蓋十億、百億、千億多個參數量級。
" 為什麼要用矩陣來解決這個問題?因為今天的大模型叫語言大模型,只有語言和文字才有真正的大模型,聲音、視頻是沒有大模型的。在我能想象的算法沒有出現極大突破之前,矩陣式是比較好的解決方案。" 周圍在接受采訪時表示。
此外,周圍也表示,矩陣式大模型也是受到用戶需求和算力成本影響的綜合結果。第一,矩陣模式可以讓用戶在雲上使用大模型的同時,在端側本地化運行關鍵數據,滿足隐私及安全需求;第二,矩陣模式可以有效平衡雲端算力成本過高的問題。
必須
縱然手機端側大模型困難重重,但參與其中正在成為手機廠商的必須。
2017 年,智能手機市場迎來了有史以來的首次下跌,以中國市場出貨量下滑 5% 為節點,宣告智能手機行業進入存量時代。2023 年第三季度,全球智能手機出貨量同比下滑 8%,出現連續 9 個季度的衰退,同時也創下了近十年同期出貨量最差紀錄。
過去數年中,面對越來越同質化的競争,手機廠商們先後在快充、續航、全面屏、攝影、高刷新率等領網域展開創新與内卷。當下,端側大模型正在成為他們渴望抓住的創新入口。畢竟,誰也不想因為錯過某一個風口而成為下一個諾基亞。
"AIGC 是我做手機以來,最讓我興奮的一個技術的創新,甚至可以說是革命。它會為移動生活的體驗帶來革命性的變化。大模型的知識超出了個體的知識,它可以像一個人一樣理解你的語言,每天觀察你、學習你、了解你的習慣,給你最好的幫助,完成你的任務。" 談及大模型時,OPPO 首席產品官劉作虎告訴《中國企業家》。在他看來,未來手機就是一個超級助理,與 ChatGPT 有異曲同工之妙。
手機廠商的大模型也正在逐步落地到其人工智能應用中,比如,華為 P60 和 Mate60 系列手機的小藝智慧助手已經接入盤古大模型。與此同時,OPPO 的小布、小米的小愛同學等均已接入各自的大模型。此外,在 vivo 最新發布的 X100 機型中,明确為用戶提供了端側大模型的下載選項功能,用戶可自願選擇是否下載,也可選擇在雲上還是本地運行。
手機端的大模型應用也确實在改善用戶的使用體驗。比如以往要找到圖庫中的某一張照片,需要非常精确地搜索關鍵詞,但是在大模型時代,只需告訴 AI 語音助手 " 之前去 xx 旅遊時拍的長城的照片 " 這樣的泛化模糊指令,就能找到相應的照片。
目前大模型在端側已經可以執行語言理解、文本創作、圖片生成等簡單的操作,但涉及到訂票、APP 互動、設備控制等操作仍需調動雲端大模型能力。但即便如此,對于手機廠商來說也是巨大的可能性。
" 我們現在就是抱着《孫子兵法》中‘先為不可勝’的心态在高飽和地投入,就是不希望被優秀的商業夥伴拉開距離,而不是一定要在大模型上進行内卷或者對抗和競争。" 談及做大模型的心态時,周圍告訴《中國企業家》。
在他看來,端側大模型的重要性跟通信、芯片是同一個級别的,未來還将變成獲取高端用戶的一個關鍵途徑。" 如果從科技巨大的生產效率的提升來看,我認為大模型也是一個歷史性的、事件級的,通過做好大模型之後,獲得更多高端用戶的認可,這是必然的,所以我們也在高規格地來投入。" 周圍補充道。
在國產手機集體喊出衝擊高端的當下,一切新的創新機會點都成為競争的新變量。何況,端側大模型的戰役已經打響。