瀾舟科技周明：大模型正在催生新AI中台

今天小編分享的科學經驗：瀾舟科技周明：大模型正在催生新AI中台，歡迎閲讀。

ChatGPT 爆火，吹起了大模型、AIGC 的風口，但伴随着興奮而來的，還有普遍的焦慮：

大模型時代，我們究竟應該做些什麼？

我想現在，一是要看到未來 AGI 的絕對趨勢；二是要找到自己的長處，腳踏實地去做；三是要營造一個好的生态環境，大家多交流、互相成就。

這就是面對如此 " 焦慮 "，世界頂級 AI 科學家、曾任 ACL 主席的周明，在首屆中國 AIGC 產業峰會現場給出的最新觀點。

2021 年 6 月，周明成立瀾舟科技，這是一家以 NLP 技術為基礎的認知智能公司。同年，瀾舟科技的 " 孟子 " 模型以 10 億參數 " 四兩撥千斤 "，登頂中文語言理解權威評測基準 CLUE。

當 ChatGPT 的大潮來襲，作為國内最先一批有準備的人，周明認為，與此前的大模型不同：

首先，ChatGPT 對用户的意圖理解非常清晰，也更加準确。

其次，多輪對話的建模非常好，還有若幹解析能力。

但同時，站在工業界角度，很多需要解析能力的任務，用單獨的引擎能達到比 ChatGPT 更好的效果。

所以，找到 ChatGPT 的應用場景非常關鍵。

基于這樣的思考，周明博士站在 To B 角度，分享了對 AI 2.0 時代進行數智化轉型的看法，從自身角度解答了 " 怎麼用 ChatGPT"、" 我們應該做什麼 " 的問題。

為了分享周明博士的更多精彩觀點，量子位在不改變原意的基礎上，對他的演講内容進行了編輯整理，以飨讀者。

演講要點

大模型時代，新的 AI 中台正在出現。

ChatGPT 對用户的意圖理解更加清晰準确，多輪對話的建模顯現若幹解析能力。

對于企業而言，并不是必須用 AI 2.0、一定要抛棄 AI 1.0。

OpenAI 和微軟做對了什麼？一是看到未來，二是發揮所長，三是互相成就。

（以下為周明演講全文）

AI 2.0 時代，不一定要抛棄 AI 1.0

過去 N 多年，企業在完成信息化之後，期待的是智能化。但其實，這個智能化過去沒有很好地發展起來。

很多企業做所謂 AI 中台，用 AI 中台支持各項業務，效果不是很理想。現在有了大模型，大家都在考慮我能不能搞一個新的 AI 中台來支持所有業務。

認知智能涵蓋很多方面的因素：第一是語言理解，第二用推理、預測、決策去解決問題。這在很多方面都有用處，包括翻譯、客服、知識圖譜、推薦問答，都是企業智能引擎的一部分。

所以如何搞一個大模型，作為某種意義上的 AI 中台來支持企業各項業務，就是我們現在要考慮的一個問題。

回到大模型，支持下遊任務無非有兩種做法：GPT-3 之前，是做模型的微調，去修改模型參數；而 GPT-3 之後，像 ChatGPT，它就是用 prompt（提示詞），不需要對大模型進行修改，通過提示就能把大模型的很多能力牽引出來解決問題。

這樣一來下遊任務的開發就變得非常簡單了，做 prompt 就可以了。

現在大家都去追 ChatGPT，其實大模型是多種多樣的，包括一開始 BERT、T5 到 GPT-1、GPT-2 等等。那麼ChatGPT 跟以前的大模型有什麼區别？

我的理解是：第一，它對用户的意圖理解更加清晰準确；第二，多輪對話的建模非常好，有若幹解析能力。

不過，站在工業界角度，很多解析能力其實不用 ChatGPT 也能做得很好，比如翻譯。用單獨的引擎跟 ChatGPT 比，可能還比 ChatGPT 厲害。

在這種情況下，到底要用 ChatGPT 來幹什麼？

兩種考慮：一個是在 ToC 層面上，AGI 能力越多越好，用户在一個簡單界面中，就可以想幹什麼幹什麼，不用來回來去翻。

另一個是在 ToB 環境下，把問題理解、多輪對話的能力，接上企業自己的核心引擎，好好結合起來。因為對于企業來説，很多 AGI 功能是基本不用的，甚至還有可能搗亂。

現在都在讨論 AI 2.0，AI 2.0 對應的是 AI 1.0。

1.0 是什麼？一個模型一個引擎，一個模型一個任務。而 AI 2.0，就是一個模型 N 個任務，甚至可以想象未來一個模型解決無窮個任務。現在當然達不到這個狀态，但是有這樣的趨勢。

好處是，一個模型 N 個任務，可以提高開發效率。另外大模型到一定程度有湧現能力，讓人產生了一些對未來人工智能深深的遐想，這是以前單模型、單任務永遠出不來的。

但對于企業而言，并不是必須用 AI 2.0、一定要抛棄 AI 1.0。

企業應該把 AI 1.0 功能引擎和 AI 2.0 的部分能力（如問題理解和多輪對話的能力）無縫對接起來，形成一縱一橫的合力。

大模型來了，能有效改進企業的智能化研發環境。過去任務太碎片化，一個任務一個模型，研發人員準備各種 feature 的代價太大，維護成本也比較高。現在有了大模型，代價就減少了很多，通過本地部署或者雲，整體開發效率提高了很多，維護也容易了。

我們就在想，有這樣的開發新範式，在企業經營場景中會有哪些新發現？

舉一個例子，金融行業用大模型，你得拿金融數據做 continue training 才會更準。再拿金融領網域常見的任務、長期積累的一些标注數據做監督學習，才能讓模型适用于真實場景。這時候再拿模型去完成一些已有任務或新任務，效率才會提高。

類似于 ChatGPT，具體怎麼用呢？一個是用 ChatGPT 打底座，做 foundation model 訓練金融大模型，另一個是用 ChatGPT，在人機互動環境下對企業的各個引擎進行調度。這樣一來，就能讓原來的智能客服具有多輪對話、意圖理解能力，推動新一代智能客服的出現。

瀾舟在做大模型的時候，尤其考慮了企業落地的問題。

第一，是大模型企業數智化應用的邊界。是把大模型當作一種分發機制，還是當成基礎模型支持下遊訓練？

第二，是大模型結果的可控性和安全性，不能一會兒對，一會兒錯。

還有，企業以前的功能引擎如何無縫地接入大模型。

最後，企業數據要如何巧妙地用起來，如何把模型做得更輕。

為此，我們訓練了孟子的一系列模型，并進行了開源。結合用户的需求，我們不追求非得是千億模型，十億、百億、千億我們都可以提供，然後基于用户的數據快速做 continue training。

基于互聯網中文數據，以及來自企業、客户的中文數據，孟子模型很懂中文。

另外，我們也做了很多 AIGC 的工作，包括小説的續寫，關鍵詞生成，實體渲染等等。

基于這些工作，我們跟中文在線合作了一個網文版類 ChatGPT 引擎。

瀾舟在做企業落地的時候，以孟子大模型為底座，拿用户行業數據和用户任務數據做 continue training 的例子，還包括和同花順一起做的金融大模型，和傳神合作的翻譯大模型，和華夏金融合作的輿情分析大模型，以及跟數説故事公司一起做的 AIGC 大模型，這些大模型都已經落地了。

多説一句，行業搜索引擎也會被重新定義。第一是從關鍵詞匹配到語言理解，第二是從數據到深度理解，第三是從簡單信息獲取到内容生產。

OpenAI 和微軟做對了什麼？

最後説一點感想。這張圖這兩天很火，是黃仁勳當時把 DGX-1 的第一台機器贈送給了 OpenAI。

現在，OpenAI 已經是 AI 領網域的翹楚，英偉達是全球科技領網域市值第五的公司，還有微軟，也堅持投入 AI，跟 OpenAI 長期合作，三家公司現在發展非常好。

他們做對了什麼？

第一，是擁抱未來。他們看到 AI 的主旋律是一定要抓住的，并且持續為之努力。

第二，是腳踏實地。每個企業都有自己的特點，OpenAI、微軟和英偉達，都是在把自己的長處發揮出來。

第三，是互相成就，而不是互相拆台。比如説微軟突然把 OpenAI 做的事都給做了，或者 OpenAI 往下遊走，去跟英偉達形成競争關系。

我想説這句話的意思是，現在咱們中國 AIGC 開始火了，大家蜂擁而上，大廠、小廠、研究機構、學生、老師都有小小的焦慮。

這時候，一是要看到未來 AGI 的絕對趨勢；二是要找到自己的長處，腳踏實地去做；三是要營造一個好的生态環境，大家多交流、互相成就，才能促進整個 AIGC 的發展。

謝謝大家！