百度「文心一言」首秀，大模型内測開啟

今天小編分享的科技經驗：百度「文心一言」首秀，大模型内測開啟，歡迎閱讀。

3 月 16 日，百度文心一言如約而至。在 ChatGPT 發布三個月後，國内終于有了第一款可以對标的產品。

文心一言是基于文心大模型推出的生成式對話產品。從今年 2 月消息外洩開始，這個項目就備受外界矚目。在百度集團内部也上升為過去兩個月裡優先級最高的項目，并由 CTO 王海峰博士親自挂帥。

李彥宏在現場展示了文心一言在文學創作、商業文案創作、數理邏輯推算、中文語境下典故理解、多模态信息生成等不同場景下的案例。

而對于目前文心一言的性能，李彥宏也坦言這類語言大模型的門檻非常高，現在的表現不算完美，會持續訓練提升。「一旦有了真實的人類反饋，文心一言的進步速度會非常快，我們都希望它快點成長，早日為用戶和客戶創造價值。」

或許正是出于這樣的考慮，百度這次在宣傳上十分低調，避開了「發布」、「推出」這樣的字眼，将此次活動命名為文心一言的「邀請測試會」。極客公園獲得内測碼後，測試了一下古文理解能力，并與 ChatGPT 做了同題對比。在古文理解上，似乎它更擅長一些。

生成式 AI 的浪潮才剛剛開始，大模型不會是最後的王炸，而是這場遊戲的牌桌。百度選擇在這個時間點發布，或許正是認為相比一個完美的產品，先有一個牌桌讓中國的玩家們參與遊戲，才是今天最重要的事情。

01 寫詩，做視頻，算雞兔同籠

會上，李彥宏表示「文心一言」對标的是 ChatGPT（亦即 GPT-3.5），甚至最新發布的 GPT-4。這意味着，文心一言需要在開放網域多輪對話的場景下，具有内容創作、知識問答、數學計算、寫作代碼等不同能力。對标 GPT-4 則又增加了處理圖片、文字等不同維度信息的能力。

李彥宏演示了文學創作、商業文案創作、數理邏輯推算、中文語境下典故理解、多模态信息生成等不同場景下的實例。

在文學創作場景中，文心一言根據對話問題将知名科幻小說《三體》的核心内容進行了總結，并提出了五個續寫《三體》的建議角度。

在商業文案創作場景中，在「建立一個大模型為中小企業數字化更新的科技服務公司」設定下，文心一言完成了給公司起名、寫 Slogan、寫新聞稿的創作任務。

在數學計算上，文心一言解答了經典的「雞兔同籠」問題。

此外，為了展示文心一言對中文語言的更強理解能力，李彥宏根據「洛陽紙貴」這一典故進行連續追問：洛陽紙貴是什麼意思？當時洛陽紙多貴；在經濟學原理中；對應的理論是什麼；寫一首藏頭詩。

在多模态的能力上，李彥宏請文心一言創作「世界智能交通大會」的海報，并讓模型用四川方言回答「智能交通最适合哪個城市發展」，并将以上内容再轉化為視頻。

信息的多模态轉換并非百度的新技術，此前在百家号中，根據文章生成短視頻即來源于此。李彥宏表示，「生成視頻因為成本比較高，還沒有對所有用戶開放，未來我們會逐步接入。」

李彥宏表示，文心一言針對中文理解，表現出更優秀的能力。不過相對于英文、代碼場景的訓練還是不夠好，接下來會繼續完善相關能力。

極客公園拿到内測碼，和 ChatGPT（GPT3.5 版本）對比了一下古文理解能力。文心一言回答對了《項脊軒志》最後一句話的含義、出處、及作者。而 ChatGPT 只回答對了句意。

總體而言，今天的發布會更像宣布了一個時間點，作為中國市場類 ChatGPT 產品空白的填充。而接下來，基于真實用戶的數據反饋，模型将持續進行迭代。

02 大模型時代，AI 技術棧變化

在上一輪深度學習熱潮中，百度開始了對 AI 的技術投入，至今已經 12 年。近十年，百度累計投入超過 1000 億元的研發開支，核心研發投入占核心收入比例連續 8 個季度超過 20%。在全棧能力積累至今，是百度能夠在短短幾個月的時間内集中突破瓶頸，将文心一言完善到可以邀請外界測試的基礎。

7 年前，當 Alpha Go 戰勝李世石，產業内外共同意識到了深度神經網絡展示其強大威力。如今，發布于 2017 年的 Transformer 被認為是比卷積神經網絡更有延展性的架構。

基于此架構，AI 從原來的識别模式發展到生成模式。形象而言，如果大模型是房屋，那麼 Transformer 便是搭建房屋的「磚頭」。

然而，訓練作為系統工程的大模型，遠遠比「搭建房屋」要復雜得多，不少有過訓練模型經驗的從業者，更喜歡用「造火箭」來形容。因此，真正要實現模型的訓練、數據閉環、持續迭代，需要全面技術能力和基礎設施支持。

在 ChatGPT 出現後，随着微軟、谷歌進入視野，首先人們意識到牌桌上巨頭的身影，以搜索業務起家的百度，也順理成章成為視野内可見的第三位巨頭玩家。

不過，可能很少有人知道，2012 年百度就曾和微軟、谷歌坐在同一張拍賣桌上。那時候，圖靈獎得主、深度學習三巨頭之一的 Geoffrey Hinton 和 Open AI 總裁 Brockman 拍賣共同創立的技術公司，當初四家競标企業之中的唯一中國身影，便是百度（另外三家分别是谷歌、微軟與 DeepMind）。

2013 年，百度建立了深度研究院（IDL），随之在 AI 領網域，開始了從芯片、框架、模型算法、到應用全面能力的布局。

在算力上，百度 2012 年即投建了陽泉計算中心。2022 年，正式更新為「智算中心」。此次，陽泉智算中心也專門搭建了一個機房支持「文心一言」訓練。該中心最高支持每秒 400 億億次浮點運算。當模型投入使用之後，這裡将與江蘇鹽城等地的其他幾座智算中心一起支持大模型的運算。

文心一言的模型演進始于 2019 年的 ERNIE 1.0，此後，百度不斷發布新模型。2021 年，發布了百億參數中英雙語的對話大模型 PLATO-X，以及知識增強大模型 ERNIE 3.0。

CTO 王海峰表示，文心一言是在 ERNIE 及 PLATO 系列模型的基礎上研發的。「文心」系列模型是百度持續研發的一系列模型，而「文心一言」則是最新研發，基于對話場景下的通用模型。

CTO 王海峰介紹「文心一言」相關技術｜來源：百度

文心模型也一直在服務百度的產品。在模型的能力的加持下，百度搜索的問題分類準确率提升 4.5%，新聞去重召回率提升 8%，視頻推薦召回率提升 10%，小度的意圖理解準确率提升了 3.1%。

王海峰介紹，在文心一言的研發過程中，深度學習框架所提供的支持也頗為關鍵。「飛槳有效支撐了大模型的靈活開發、高效訓練和推理部署。」飛槳平台，也是百度 AI 技術成果的重要部分。目前，飛槳是除了國際兩大主流框架 TensorFlow 和 PyTorch 之外，國内影響最大的深度學習框架，平台上開發者數量已經達到 535 萬，創建 AI 模型超過 67 萬個。

生成式 AI 讓市場的需求爆發式增長，意味着除了底層模型的開發人員之外，需要更多開發者加入，進行不同環節、不同層面的開發工作。這也意味着基于大模型，會形成新的技術棧。

提到基于模型開發 AI 應用，李彥宏表示「文心一言讓每一家公司離客戶更近，利用新的能力，做出更好的客戶體驗」。服務客戶，首先需要服務開發者。當學習框架與底層模型的訓練适配，無疑能為更多開發者基于通用模型繼續開發應用，提供更友好的環境。

03 李彥宏：大模型帶來三大產業機會，「模型即服務」是未來的雲

演講中李彥宏坦言，目前文心一言的效果尚不完美。王海峰也表示，在對大模型的最終訓練環節中，在人類反饋的強化學習（RLHF）上做的還不夠充分。

但大模型的市場需求日益增長，國内大模型的空白急需填補，這是百度選擇在今天發布的原因之一。邀請測試會的最後一個環節，百度正式宣布了向 C 端和 B 端開放測試。首批用戶采用邀請制，可以通過邀請碼在「文心一言」官網進行產品體驗；面對企業用戶，百度智能雲開放 API 接口調用。

李彥宏還透露，近期，百度智能雲将召開發布會。屆時，将圍繞文心一言的雲服務和應用產品做介紹。接入了大模型的智能，既能夠提供公有雲服務，也可以做私有化部署。

而在上個月的 Q4 财報電話會上，他便強調了大模型對于雲服務的加持。「之前選擇雲廠商更多看算力、存儲等基礎雲服務。未來，更多會看框架好不好、模型好不好，以及模型、框架、芯片、應用之間的協同。這會根本性地改變雲計算市場的遊戲規則。」

李彥宏介紹「文心一言」｜來源：百度

這也是百度智能雲的新機會。在文心一言發布會上，李彥宏提出，大模型将會帶來新型的雲計算。主流商業模式從将從 IaaS 變為 MaaS。所謂 Maas，是「模型即服務」。依托雲設施，模型将其推理能力快速接入軟體公司，後者能夠做出更新的產品體驗。

傳聞中投資 OpenAI 百億美金的微軟，也在做相同的布局。目前，GPT-4 的模型能力也已經集成在微軟 Azure 中，并通過雲服務的方式向外提供服務，即為 Azure OpenAI 產品。微軟還表示，為了能夠支持大模型的持續更新，針對大語言模型培訓，專門優化了 Azure 的基礎設施。

李彥宏認為，大模型将為 AI 產業帶來三大機會，雲服務是其中之一，另外兩個分别是「行業模型精調」、「基于大模型底座進行應用開發」。

前者服務的是企業客戶，應用行業 Knowhow，提供垂直領網域解決方案；後者直接面向普通用戶開發產品，在文本生成、影像生成、音頻生成、視頻生成、數字人、3D 等場景，今天已經湧現出很多創業明星公司，他們可能就是未來的新巨頭。

值得注意的是，要實現模型能力的大規模發放，還需要解決部署端的快速調用問題。目前出現「智能湧現」的大模型，參數達到了一定量級之後，在多種任務的能力上，都具備了小模型所不具備的能力水平。并且這種表現是「突然出現」的。這使得在模型的綜合表現令人驚喜，也成為 ChatGPT 已經具備了產品屬性的原因。

當人們使用模型回答問題、整合信息，或者創作能力生成文本草稿時，便是在調用模型的實時計算推理能力。這與訓練模型所需求的數據訓練、參數調優等能力相比，需要的是基礎設施支持上的軟硬體協同效率、服務穩定性的能力。

如何實現靈活地調用模型能力，也将是構建商業模式的關鍵。這裡面可能涉及到很多具體挑戰，比如對于數據隐私要求極高的醫療、金融等行業，不适合将數據直接接入大模型。而領網域的專業性要求，又需要基于通用能力，基于專業數據進行精調。

大模型的訓練成本極高。将大模型微調後，服務于相關企業，如何既保留大模型的能力，又節約算力成本，并實現本地化部署、迭代，将是未來服務行業需要解決的問題。

目前，百度積累了芯片、框架、模型、應用的四層技術架構。李彥宏表示，「在全球範圍内，在四層架構的每一層都有領先產品的公司幾乎沒有，百度的優勢非常獨特，相信大家會在後續文心的迭代速度上有明顯感受。」

文心一言的測試開始，也意味着數據飛輪即将啟動。随着真實用戶反饋的建立，在 AI 上積累了十多年，百度的機會剛剛開始。