今天小編分享的互聯網經驗:大模型競賽棋至中局,騰訊“混元”加入戰場,歡迎閱讀。
圖片來源:視覺中國
中國市值最高的互聯網巨頭騰訊,在科技界的期待與壓力之下,終于向公眾披露了其通用大模型進展。
9 月 7 日,在 2023 年騰訊全球數字生态大會上,騰訊混元大模型正式對外公布。據騰訊介紹,騰訊混元大模型擁有超千億參數規模,預訓練語料超 2 萬億 tokens,具有強大的中文理解與創作能力、邏輯推理能力,以及可靠的任務執行能力。
此外,騰訊還表示,混元大模型已經接入騰訊 50 多項業務并取得初步效果,包括騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ 浏覽器等業務和產品。
據騰訊稱,混元大模型将作為騰訊雲 MaaS(Model-as-a-Service,模型即服務)服務的底座,企業用戶不僅可以直接調用混元,也可以将混元大模型作為基底模型,為不同產業場景構建專屬應用。
在大模型競賽風起雲湧的上半場,騰訊的動作并不算快。" 我們最開始以為這是互聯網十年不遇的機會,但是越想越覺得這是幾百年不遇的、類似發明電的工業革命一樣的機遇。AI 非常重要,但這的确需要有很多的積累。" 騰訊 CEO 馬化騰于今年 5 月股東大會上的這句話,解釋了騰訊的行動邏輯,他認為,對于工業革命來講,早一個月把電燈泡拿出來在長的時間跨度上來看是不那麼重要。
騰訊稱,早在 2020 年,騰訊就開始研發混元,今年 8 月,混元已經進入公司内應用測試階段,但一直沒有披露最終進展。
在大會上,騰訊集團副總裁蔣傑表示," 在文檔處理方面,混元優于國内某大模型,采納率高出 6 倍,在 Excel 公式的準确性,也遠遠超過 GPT 3.5;在廣告業務場景方面,騰訊混元大模型廣告效果超過 Midjournry。"
在騰訊推出混元之前,2023 年以來,科技巨頭們已經開啟了你追我趕的大模型競賽。
國内最早發布大模型的巨頭是百度。3 月 16 日,百度宣布正式推出文心一言,并宣布開放測試邀請。百度創始人、董事長兼首席執行官李彥宏曾表示,模型本身是不直接產生價值的,基于基礎大模型開發出來的應用才是模型存在的意義。對于創業者來說," 卷大模型沒有意義,卷應用機會更大。"8 月 31 日,百度大模型文心一言率先向全社會開放,應用商店搜索 " 文心一言 " 可直接下載。
而阿裡巴巴在 2023 年 4 月緊随百度之後發布了大模型 " 通義千問 ",阿裡雲随即更新其音頻轉寫平台 " 聽悟 ",并配備 AI 驅動的會議分析能力;7 月,阿裡雲推出生成式 AI 文生圖模型 " 通義萬相 ";8 月,阿裡雲通義千問 70 億參數通用模型和對話模型,兩款模型目前均開源、免費、可商用。
阿裡巴巴集團董事會主席兼首席執行官張勇曾表示,今天做大模型的公司不少,在中國,往後無非是兩條路,一條是像阿裡,和雲一起,基礎模型是普惠的,讓更多的開發者來使用;二是企業從基礎模型入手,但對某些領網域聚焦,這取決于相關企業在該領網域數據的質量和規模。" 我想會有一大批這樣的企業,從大模型起家,而後進入特定領網域。"
360 創始人周鴻祎則說,不要神化大模型," 大模型最核心的能力是寫作生成和知識問答,企業客戶可以先在一個小切口場景把大模型用起來,再去跟自身業務做協同。" 此前,"360 智腦 " 大模型已面向公眾開放。據 360 公布的 2023 年半年報數據顯示,"360 智腦 " 已經為 360 帶來了近 2000 萬元的相關業務收入。
值得關注的是,在同日舉辦的第二屆外灘大會上,螞蟻集團董事長兼 CEO 井賢棟表示,螞蟻把科技作為最核心的競争力,最重要的生產力,發展根本的驅動力,對大模型高度重視,全情投入。據他透露,螞蟻将在 9 月 8 日發布的大模型,是全棧布局的、純自研的。
從最初的算法和算力再到如今的應用場景,大模型的入局者越來越多,應用前景也逐漸貼近現實。據藍鲸财經記者不完全統計,到目前為止,國内已經發布超 130 個大模型," 百模大戰 " 已經開啟,除了這些巨頭之外,還有王小川創業的百川智能、" 商量 SenseChat" 大模型的商湯科技、" 星火認知 " 大模型的科大訊飛等多家公司加入戰局。