谷歌發布大模型，國内“百模大戰”鏖戰正酣

今天小編分享的互聯網經驗：谷歌發布大模型，國内“百模大戰”鏖戰正酣，歡迎閲讀。

圖片來源 @視覺中國

文｜趣解商業，作者 | 周佟

2022 年底，OpenAI 發布 ChatGPT 掀起了人工智能熱浪，時隔一年後，谷歌終于 " 殺回 " 人工智能賽道。

當地時間，12 月 6 日，谷歌正式發布了 Gemini 大模型。谷歌 CEO 桑達爾 · 皮查伊稱，Gemini 的發布，是谷歌新時代的開始；但人們最關注的問題還是 Gemini 和 GPT-4 相比水平誰更高。

谷歌公司高管稱，三種不同版本的套件中的 Gemini Pro，表現優于 GPT-3.5，但暫未直接回應 Gemini 與 GPT-4 相比表現如何的問題。不過外界有測評認為，它們已經超過了 GPT-4。

圖片來源：微博截圖

不管是否超過，作為大模型的 " 風向标 "，由一年前推出的 ChatGPT 引發的 " 生成式人工智能 " 革命，仍在不斷地改寫着每個人的認知。

如今巨頭谷歌已 " 上線 "，過去一年，在 ChatGPT 的引領下，國内的大模型企業也從摸索和嘗試，逐漸步入深水區。

" 百模大戰 "，從震驚到追趕

ChatGPT 的出現并非毫無征兆。

創造它的 OpenAI 早在 2015 年便已成立，并在 2018 年就推出了初代生成式預訓練模型 GPT-1，這也是 ChatGPT 最初的原型。

公開資料顯示，在 GPT-1 之前，業内的 NLP 模型（Neuro logic level 自然語言處理）主要是基于針對特定任務的大量标注數據進行訓練，能力有限。

GPT 是第一個結合 Transformer（多層變換器）結構和自監督預訓練目标的模型，在自然語言推理、問答任務和常識推理等方面取得了突破，為此它們也獲得了微軟 10 億美元投資。随後，從 GPT-1 到 GPT-2，到 GPT-3，短短 2 年時間裏 GPT 的能力不斷提高。

圖片來源：OpenAI 官網截圖

2022 年 11 月 27 日，随着由 GPT-3.5 修改而來的人工智能對話聊天機器人 ChatGPT 的推出，這個一直在小圈子走紅的研究成果，才第一次為大眾所認識。能聊天、畫畫、寫文案、編代碼，強大的功能，使得 ChatGPT 一經發布迅速走紅，5 天時間注冊用户數超過百萬，兩個月時間月活突破 1 億，成為史上增長最快的消費者應用。

消息傳至國内，一石激起千層浪。人工智能竟然已經發展到如此地步了？震驚之下，淘寶上售賣 ChatGPT 賬号甚至都成了一門生意。與此同時，看到巨大商機的各界大佬們，也紛紛下場，表态要盡快推出自己的大模型。

率先落地的是百度。2023 年 3 月 16 日，國内首個大語言模型 " 文心一言 " 問世，發布會上，百度 CEO 李彥宏直言，" 生成式 AI 是任何企業都不應錯過的大機會 "。

而百度之所以能夠拔得國内大語言模型的 " 頭籌 "，源自其過去 10 多年中，在 AI 研發上的堅持投入。按李彥宏的説法，文心大模型的第一個版本早在 2019 年就發布了，此後每年都有更新，文心一言的發布只是百度多年努力的 " 自然延續 "。

緊接着，3 月 29 日，360 集團發布人工智能戰略及 360 智腦大模型 1.0 版本，創始人周鴻祎現場演示了大模型在搜索場景的應用。4 月 11 日，阿裏巴巴的 " 通義千問 " 大模型在阿裏雲峰會上揭曉，CEO 張勇宣布未來阿裏巴巴所有產品都将接入 " 通義千問 "。5 月 6 日，科大訊飛星火大模型發布，董事長劉慶峰表态要在 10 月 24 日實現中文超過 ChatGPT，英文趕上 ChatGPT。9 月 7 日，騰訊混元大模型上線。

至此，國内傳統的三大互聯網巨頭 "BAT" 全部下場。

此外，華為、京東、字節跳動、商湯科技、昆侖萬維等等都陸續推出了大模型產品，甚至連移動、聯通、電信三大運營商，長虹等家電生產企業，清華、復旦、中科院等科研院所和高校，都發布了各自的大模型。

5 月底舉行的中關村論壇上，有專家披露，中國 10 億級參數規模以上大模型已發布了 79 個；在 7 月初的 2023 世界人工智能大會中有信息表明，中國已有 130 家研發大模型的公司。此時，ChatGPT 引起的大模型研發熱，已經帶動國内形成 " 百模大戰 " 的格局。

不過相比當初外賣界的 " 百團大戰 "，" 百模大戰 " 對資金的需求更為苛刻。

根據 NVIDIA 官方信息，在訓練底層模型階段，訓練一次 1750 億參數的 GPT-3 需要 34 天、使用 1024 張 A100 GPU 芯片，而為了維持日常推理，OpenAI 至少需要 3.24 萬張 A100，以此推算，ChatGPT 僅硬體成本就超過了 8 億美元。

昆侖萬維集團 CEO 方漢更是公開表示，" 沒有 2000 張 A100 的卡，實驗都做不了 "。為此，海天瑞聲、因賽集團等 "AI 概念股 " 甚至接連發布定增預案，募集資金用于訓練大模型。

此時，如何在縮小與 ChatGPT 差距的同時，盡快找到應用落地的方向，實現自我造血，成為了 " 百模大戰 " 中，每一位參與者都要面對的問題。

人工智能 + 将所有行業做一遍？

從商業角度分析，大模型帶來的機遇，可以概括為成本減少效率提升、原有市場需求再擴大、創造新的市場需求三大類。

在今年 8 月 31 日、11 月 4 日，根據網信辦《生成式人工智能服務管理辦法（征求意見稿）》的要求，國内先後有兩批涉及 26 家公司的 AI 大模型和 151 個深度合成衣務算法通過備案，陸續向全社會開放服務，其中的商業化嘗試，也基本是圍繞這三類展開的。

圖片來源：網信辦截圖

大模型超強的人機對話、圖文及音視頻生成能力，不但讓其在傳統客服場景中獲得了廣泛應用，對于遊戲、影視制作等也產生了深遠影響。

阿裏、美團的在線智能客服算法，以及中國移動的 " 九天大模型 "、中國電信的 TeleChat 大模型等，都屬于此類產品，将應用場景直接鎖定在了智能客服、智慧政務等方面。在今年的亞運會上，科大訊飛與中國移動聯合推出了基于星火大模型的 5G 新通話，接完電話之後，申請服務，會即刻轉成文字、生成紀要、生成待辦事項。

遊戲、影視制作方面，導演陸川曾在采訪時表示，" 用 AI 畫電影海報，15 秒出來的效果比專業海報公司做一個月的還要好。" 光線傳媒、華策影視等率先嘗試将大模型應用在影視創作中的公司，股價在年中都收獲了一波大漲。

原有市場需求再擴大，則體現在對于傳統業務的更新上，這也是大模型應用最廣泛的領網域。以傳統的搜索引擎為例，接入文心一言後，在百度搜索框裏輸入問題，給出的可以不再是鏈接，而是一個更準确的答案。

10 月 17 日，文心一言 4.0 發布，根據李彥宏現場的演示，除了搜索外，百度地圖、網盤、文庫等十餘款應用，都接入文心一言完成了重構。

旗下業務眾多的騰訊，對騰訊雲、騰訊廣告、騰訊遊戲、騰訊會議等多個業務和產品，也已完成了接入騰訊混元大模型的測試，并取得了初步效果。

圖片來源：騰訊混元官網截圖

此外，在傳統的教育、醫療、汽車等領網域，大模型也獲得了廣泛的應用。接入訊飛星火大模型後，科大訊飛的學習機實現了 AI 一對一輔助教學、中英文作文批改、口語陪練等功能；百度推出了產業級的醫療行業大模型 " 靈醫 "，有超過 1000 家企業級機構先行體驗；華為雲盤古大模型的賦能，則讓問界新 M7 在智能駕駛領網域 " 遙遙領先 "，兩個月大定突破 10 萬台。

在創造新的市場需求方面，AI 超級助理、AI 機器人等需求也被不斷創造出來。前者，包括文心一言、訊飛星火、360 智腦、通義千問等在内的各家通用大模型都有相應產品提供，它們大都能理解用户的語言語義，并具備影像理解能力，可以通過調用軟體 API，使用各種各樣的工具來幫助用户完成任務；而後者，在今年 8 月 16 日舉行的 2023 世界機器人大會上，包括優必選、追覓、宇樹在内的不少于 10 家機器人企業，展出了相關產品，賽道也正呈現井噴态勢。

圖片來源：通義官網截圖

不過，在一片欣欣向榮背後，也存在隐憂。比照各家大模型的應用不難發現，不管是提高效率還是擴大需求，市場上絕大多數的應用，實現的功能都較為雷同。

以 AI 學習機為例，除了科大訊飛有相關產品外，接入子曰大模型的網易有道、接入 MathGPT 的好未來、接入銀河大模型的作業幫，以及接入文心一言的百度、接入 360 智腦的 360，都有類似的產品在售。功能方面，各自宣傳的也都大同小異，AI 一對一輔導、全科 AI 作業助手、虛拟人口語教練等，站在消費者的角度，幾乎很難體會到其中的差别。

盡管各家都能拿出一堆的排名榜單來論證，自己的大模型得分更高、能力更強，但體現在實際應用中時，那百分之幾甚至是千分之幾的差别，還是讓人不得不產生疑惑：我們真的需要這麼多大模型嗎？

AI 原生應用至上，亟待 " 安卓 " 出現

對于大模型步入 " 深水區 " 将會遇到的挑戰，百度創始人、董事長兼首席執行官李彥宏提出了自己的看法。

近期，在深圳 2023 西麗湖論壇開幕式上，李彥宏就直言，擁抱 AI 時代，是 " 一把手工程 "。因為 CTO、IT 負責人更關注技術本身，認為自己做大模型是交作業，結果不僅資源浪費，而且用不起來，最後一地雞毛；只有一把手才會真的關注，新技術如何提升自己業務的關鍵指标，一把手上陣，才能讓新技術真正為企業所用。

不斷地重復開發基礎大模型是對社會資源的極大浪費。在李彥宏看來，國内如今的大模型實在是太多了。根據統計，截止 10 月份，國内已經發布的大模型達到了 238 個，比 5 月科技部統計時的 79 個，翻了三倍，但與此同時，市場上真正的 AI 原生應用卻很難找出幾個。一把手應該主導做 AI 原生應用，而不是大模型。

"人類進入 AI 時代的标志，不是產生很多的大模型，而是產生很多的 AI 原生應用。" 李彥宏認為，大模型時代其實和 PC 時代、移動互聯網時代極為類似。PC 時代，主流的作業系統只有 Windows 一個，移動互聯網時代，也基本只有安卓和 iOS 兩家，然而圍繞着它們，誕生了無數的應用軟體。

大模型本身也屬于基礎底座，類似作業系統，最終開發者要依賴為數不多的大模型來開發出各種各樣的原生應用。"AI 原生時代，我們需要 100 萬量級的 AI 原生應用，但是不需要 100 個大模型。"

這确實是國内的大模型玩家們不得不面對的難題。盡管市場上大模型產品有幾百個，但細究起來都是在各玩各的，360 智腦只為自家搜索賦能，訊飛星火此前主要是為科大訊飛的學習機產品服務。

相比大模型訓練的高額花費，如果不能夠有效擴大 " 朋友圈 "，讓自家的大模型為更多人所用，只是一味投入，顯然難以為繼。

上半年大漲的 AI 概念股們，下半年幾乎集體熄火，與此不無關系。科大訊飛（002230.SZ）10 月 19 日發布的三季報顯示，前三季度實現營業收入 126 億元，同比下滑 0.27%，淨利潤 9936 萬元，同比跌了 76%。根據公告，其利潤下滑的主要原因，就是源自對大模型的 " 堅定投入 "。

圖片來源：财報截圖

三六零（601360.SH）的情況也沒有好多少，上半年盡管新興業務 "360 智腦 " 創造了近 2000 萬元營收，但在 9.1 億元的總收入中，占比不過 2.1%。

在 " 百模大戰 " 進入深水區後，如何圍繞各自的大模型，" 擴大朋友圈 " 創造生态，争取更多的開發者，成了國内通用大模型玩家們不約而同的選擇。

在 1024 開發者節上，科大訊飛董事長劉慶峰透露，除了聯合相關企業發布了包含金融、汽車、住建、法律等在内的 12 個行業大模型外，在訊飛星火上，已有 1.5 萬助手開發者，開發了超過 2.9 萬個助手應用。

百度則先後推出了 " 百度智能雲千帆大模型平台 "、" 靈境矩陣 "，幫助企業開發自己的專屬大模型，目前平台月活企業數已近萬家。

阿裏巴巴旗下的通義千問，從 18 億、70 億、140 億到 720 億參數規模，率先成為業界首個 " 全尺寸開源 " 的大模型，以吸引更多合作夥伴加入，共促通義千問生态建設。

去年 11 月，阿裏巴巴發布 AI 開源社區 " 魔搭 "，中國 80% 的大模型研發機構把魔搭作為模型開源的首發平台。短短一年時間，魔搭匯聚了 280 萬開發者、2300 多個優質模型，模型下載量超過 1 億。

正如中國科學院院士、中國計算機學會（CCF）開源發展委員會主任王懷民所説，開源是 AI 發展的重要驅動力，AI 開源社區不僅将有力推動 AI 邁向廣泛的落地應用，還将助力中國從開源世界的參與者逐步成長為引領者。

大模型行業的未來，如智能手機系統的迭代。曾經，除了蘋果的 iOS 外，手機作業系統中還有諾基亞的 Symbian、微軟的 Windows Phone、黑莓的 BlackBerry，但是最終它們無一例外都敗給了 " 在 2012 年，就擁有 10 萬開發者，超過 40 萬活躍應用 " 的 Android。

期待國產大模型們，早日跑出本賽道的 "Android"。