大模型競賽棋至中局，騰訊“混元”加入戰場

今天小編分享的互聯網經驗：大模型競賽棋至中局，騰訊“混元”加入戰場，歡迎閱讀。

圖片來源：視覺中國

中國市值最高的互聯網巨頭騰訊，在科技界的期待與壓力之下，終于向公眾披露了其通用大模型進展。

9 月 7 日，在 2023 年騰訊全球數字生态大會上，騰訊混元大模型正式對外公布。據騰訊介紹，騰訊混元大模型擁有超千億參數規模，預訓練語料超 2 萬億 tokens，具有強大的中文理解與創作能力、邏輯推理能力，以及可靠的任務執行能力。

此外，騰訊還表示，混元大模型已經接入騰訊 50 多項業務并取得初步效果，包括騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ 浏覽器等業務和產品。

據騰訊稱，混元大模型将作為騰訊雲 MaaS（Model-as-a-Service，模型即服務）服務的底座，企業用戶不僅可以直接調用混元，也可以将混元大模型作為基底模型，為不同產業場景構建專屬應用。

在大模型競賽風起雲湧的上半場，騰訊的動作并不算快。" 我們最開始以為這是互聯網十年不遇的機會，但是越想越覺得這是幾百年不遇的、類似發明電的工業革命一樣的機遇。AI 非常重要，但這的确需要有很多的積累。" 騰訊 CEO 馬化騰于今年 5 月股東大會上的這句話，解釋了騰訊的行動邏輯，他認為，對于工業革命來講，早一個月把電燈泡拿出來在長的時間跨度上來看是不那麼重要。

騰訊稱，早在 2020 年，騰訊就開始研發混元，今年 8 月，混元已經進入公司内應用測試階段，但一直沒有披露最終進展。

在大會上，騰訊集團副總裁蔣傑表示，" 在文檔處理方面，混元優于國内某大模型，采納率高出 6 倍，在 Excel 公式的準确性，也遠遠超過 GPT 3.5；在廣告業務場景方面，騰訊混元大模型廣告效果超過 Midjournry。"

在騰訊推出混元之前，2023 年以來，科技巨頭們已經開啟了你追我趕的大模型競賽。

國内最早發布大模型的巨頭是百度。3 月 16 日，百度宣布正式推出文心一言，并宣布開放測試邀請。百度創始人、董事長兼首席執行官李彥宏曾表示，模型本身是不直接產生價值的，基于基礎大模型開發出來的應用才是模型存在的意義。對于創業者來說，" 卷大模型沒有意義，卷應用機會更大。"8 月 31 日，百度大模型文心一言率先向全社會開放，應用商店搜索 " 文心一言 " 可直接下載。

而阿裡巴巴在 2023 年 4 月緊随百度之後發布了大模型 " 通義千問 "，阿裡雲随即更新其音頻轉寫平台 " 聽悟 "，并配備 AI 驅動的會議分析能力；7 月，阿裡雲推出生成式 AI 文生圖模型 " 通義萬相 "；8 月，阿裡雲通義千問 70 億參數通用模型和對話模型，兩款模型目前均開源、免費、可商用。

阿裡巴巴集團董事會主席兼首席執行官張勇曾表示，今天做大模型的公司不少，在中國，往後無非是兩條路，一條是像阿裡，和雲一起，基礎模型是普惠的，讓更多的開發者來使用；二是企業從基礎模型入手，但對某些領網域聚焦，這取決于相關企業在該領網域數據的質量和規模。" 我想會有一大批這樣的企業，從大模型起家，而後進入特定領網域。"

360 創始人周鴻祎則說，不要神化大模型，" 大模型最核心的能力是寫作生成和知識問答，企業客戶可以先在一個小切口場景把大模型用起來，再去跟自身業務做協同。" 此前，"360 智腦 " 大模型已面向公眾開放。據 360 公布的 2023 年半年報數據顯示，"360 智腦 " 已經為 360 帶來了近 2000 萬元的相關業務收入。

值得關注的是，在同日舉辦的第二屆外灘大會上，螞蟻集團董事長兼 CEO 井賢棟表示，螞蟻把科技作為最核心的競争力，最重要的生產力，發展根本的驅動力，對大模型高度重視，全情投入。據他透露，螞蟻将在 9 月 8 日發布的大模型，是全棧布局的、純自研的。

從最初的算法和算力再到如今的應用場景，大模型的入局者越來越多，應用前景也逐漸貼近現實。據藍鲸财經記者不完全統計，到目前為止，國内已經發布超 130 個大模型，" 百模大戰 " 已經開啟，除了這些巨頭之外，還有王小川創業的百川智能、" 商量 SenseChat" 大模型的商湯科技、" 星火認知 " 大模型的科大訊飛等多家公司加入戰局。