7個月了，中國 AI 大模型學不來ChatGPT

今天小編分享的财經經驗：7個月了，中國 AI 大模型學不來ChatGPT，歡迎閲讀。

（圖片來源：Unsplash）

與此前幾周的人工智能（AI）相關會議情況類似，2023 全球數字經濟大會人工智能高峰論壇上，企業家、學術界紛紛探讨大模型、生成式 AI 技術對于社會和產業界的影響。

" 前幾個月大家都在讨論 OpenAI 和中國什麼時候能夠做出自己的大模型，這幾個月大模型層出不窮，我看到很多投資人開始急了。"360 公司董事長周鴻祎在論壇演講中表示，大模型真正的機會在中國，尤其是企業級市場，包括政府和城市，而中國做大模型最應該抓住產業互聯網發展的機會。

曠視科技聯合創始人唐文斌，智譜 AI CEO 張鵬，銜遠科技創始人、清華大學惠妍講席教授周伯文等嘉賓也在現場表示認同這一看法，他們普遍認為，大模型不應該再消耗大量資金做 ChatGPT 這類千億級參數的通用大模型，而是應該打造十億級行業大模型，深入 To B 行業解決方案，解決垂直領網域的實際問題。

事實上，随着 ChatGPT 掀起中國 AI 大模型的投資、產業發展熱潮，企業紛紛效仿 ChatGPT 争做 " 中國版 OpenAI"，現在已有超過 80 個大模型公開内測。

但問題在于，" 卷 " 了七個月後很多投資人、企業家發現，大模型技術門檻并不高，同時算力價格持續攀升，成本高居不下，企業急需盈利，需要尋找大模型的商業化方案，而 ChatGPT 的 " 每月 20 美元 "Plus 會員服務在國内只能變 " 免費 "，OpenAI 那種持續性 AI 技術投入在國内行不通。

最終發現，能給 " 大模型 " 買單的只有政務、金融、醫療等幾個垂直領網域客户。

钛媒體 App 編輯統計國内 AI 大模型數據最新信息

企業不再拼 AI 大模型技術，而是回歸商業化

過去半年多時間，以 ChatGPT、GPT-4 為代表的大模型技術，引領了新一輪全球 AI 創新熱潮。國内外大模型科研高速迭代，各類模型層出不窮，模型性能不斷提升。

在國内，從百度文心一言、阿裏通義千問、華為盤古大模型，再到 360 智慧大腦、智譜 AI ChatGLM 等，各行各業都在打造大模型。據北京市經濟和信息化局局長姜廣智最新透露，迄今中國已有 80 餘個大模型公開發布，其中北京約占一半（超 40 個）。

" 我們好像爬了很長時間的山，終于見到了新的高峰、見到了新的曙光。" 姜廣智在致辭時表示，過去二十多年，經歷了互聯網、智能手機、雲計算、大數據、物聯網這一系列 IT 技術的重大變化，深刻地改變了我們的生產生活等各個方面，現在我們又迎來了通用 AI 的新時代。

不過，相比 ChatGPT 這類消費級平台的付費模式，中國 AI 大模型普遍免費内測使用，用户只要在平台申請内測就能得到使用許可。不僅如此，" 百模大戰 " 下人人都做大模型，很難形成企業自身和產業壁壘，加上 AI 算力成本高昂，大模型的商業化沒有想象當中那麼容易。

簡單來説，國内 AI 大模型與 OpenAI 的商業模式、技術成本相距甚遠。OpenAI 能投入數億美元的算力訓練成本，國内中小 AI 公司無法達到，尤其大部分都集中于應用端。

" 參數量其實是一個辯證的問題。千億萬億參數只是代表你最高的能力，但高參數意味着思維能力要求更高、算力高，而客户場景不一定需要這麼高的算力要求，因為不是所有場景都能接受千億參數量成本。" 第四範式創始人、CEO 戴文淵今年 5 月對钛媒體 App 表示，在各種條件制約以及企業尋找盈利下，To B 客户均開始選擇成本可控的垂直 AI 大模型。

在 2023 全球數字經濟大會人工智能高峰論壇上，周鴻祎、張鵬、周伯文等嘉賓都普遍提到大模型的 " 行業化 "、" 垂直化 "，深入政務、金融、文創、醫療等行業拓展，同時也圍繞模型安全、可信、可控進行讨論。

周鴻祎認為，大模型真正的機會在企業級市場，中國做大模型，最應該抓住產業發展的機會。但目前的公有大模型用在政府、城市、行業等企業級場景時，存在四點不足，包括缺乏行業深度、數據安全隐患、無法保障内容可信、訓練和部署成本過高等。

" 公有大模型存在很多數據安全隐患。每個企業自己内部的 Know-how 是核心資產，肯定不會訓練到公網域大模型；公有大模型使用會有數據泄露的問題，因為很多想法和計劃都要告訴它，它才能寫出一篇好的文章；公有大模型是生成式 AI，本身算法的特點就是會胡説八道，而且是一本正經、理直氣壯地胡説八道，這個特點用來做小説、寫劇本，作為聊天機器人逗悶子效果很不錯，但放在企業級場景問題就很大，要是真的拿醫療大模型開的藥方，你敢不敢相信、敢不敢吃；公有大模型無法實現成本可控，因為大模型成本之高也被渲染得很厲害，訓練一次要一千萬美金，需要多少算力、多少顯卡，企業内部做垂直大模型不用追求知識的全面，也不用追求能力面面俱到，百億模型可能就足夠了，千億到百億看起來參數做小了十倍，節省的訓練和部署成本可遠遠不止十倍。"

周鴻祎直言，未來企業級市場真正需要的大模型要符合行業化、企業化、垂直化、小型化、專有化等特點。不僅如此，在他看來，構建企業級大模型要堅持以下三個原則：

1、安全：首先是安全原則，大模型存在網絡安全、數據安全、算法安全等風險，特别在生成内容安全方面，目前已經有人利用 AIGC 生成各種以假亂真的内容用于詐騙，且治理起來比搜索引擎要復雜很多。因此人工智能安全的問題需要從現在開始着手研究。

2、可信：其次是可信原則，可通過企業知識庫和搜索的校正解決大模型的 " 幻覺 " 問題，以及知識不能及時更新問題。" 如何解決輸出内容準确的問題？現在可以通過向量數據庫、企業搜索和外部知識庫進行校正。"

3、可控：最後是可控原則，周鴻祎認為，大模型目前還有點不靠譜的情況下，建議企業和政府使用大模型時，一開始步子可以小一點，不要向它開放 API、插件和函數模式，還是要堅持它是一個助手，最後人是在決策的 " 回路 " 上。他在 PPT 中提到，要采取監控審計手段，把大橫型 " 關在籠子裏 "。

對于企業如何使用大模型，周鴻祎強調，企業大模型首先要用好通用能力，充分發揮大模型最擅長、最成熟的能力；着眼企業痛點和剛需，小切口，大縱深，比如信息分析和決策、企業知識搜索和管理、辦公協作和智能客服等辦公場景，都是最合适的切入點。

同時，周鴻祎還建議企業在使用大模型時先開啓 " 助手 " 和 " 副駕駛 " 模式，讓大模型與現有的業務系統保持相對獨立，保持隔離度，對企業來説也更安全可控。此外，企業大模型應當領導、員工都能用，做到 AI 普惠。

" 老是有人渲染應用大模型就要大裁員，搞得很多員工對大模型很抵觸。我堅決反對這個觀點，大模型目前想獨立完成一項工作還是很難的，更多的定位是人類很好的工具、知識的助手，所以大模型的發展要以人為本。" 周鴻祎提到，易用好用是大模型發展的第一原則。

周鴻祎判斷，數字人将成為企業級大模型的重要入口和承載形式。此前 360 智腦發布的 " 有靈魂 " 的數字助理，可解決大模型的易用性難題。此次現場，周鴻祎還展示了定制化的 " 北京客服問不倒 " 和 " 北京城市招商寶 "，為北京市訓練的兩個大模型數字人，解決一些政企領網域的核心需求。

不僅是周鴻祎，智譜 AI CEO 張鵬提到，從商業落地角度來説，智譜 AI 提出 MaaS（Model As A Service）大模型服務理念，是希望讓千億級、高精度的大模型被更多個人和企業使用，享受 AI 賦能。

" 我們有三個版本，一是有端到端模型訓練服務，已經在自建算力平台上幫助大家完成若幹模型遷移訓練；二是提供模型搭建服務，提供 License；三是和雲計算廠商合作，提出 API 調用以及 Model Instance 服務，幫助大家能夠快速構建強大的基礎設施能力。" 張鵬表示。

钛媒體 App 了解到，智譜 AI 正在研發新的 ChatGLM2 大模型產品，參數量減少但數據質量提升，相比于初代模型，ChatGLM2-6B 在數理邏輯、知識推理、長文檔理解等多個維度的能力上，都取得了巨大的提升。在多個評測中，ChatGLM2 得分要超過 GPT-4 和 ChatGPT。

銜遠科技創始人、清華大學惠妍講席教授周伯文則表示，Al 能否與業務充分結合，是決定 Al 能否實現經濟價值的關鍵因素。只有緊貼業務的 Al 戰路設計、完善的配套架構、充足的 Al 人才，以及健全的内部培養機制，才能使 AI 與業務發展需求充分融合，最大化經濟收益。

昆侖萬維 CEO 方漢則認為，目前來看大模型處于 B 端降本，C 端增效狀态。

他認為，中國的 B 端服務企業，可以看到很難有一家企業能夠壟斷整個 B 端服務。由于大模型對行業數據的需求，B 端必然會出現每家大模型企業都能夠在一兩個行業中取得先發成功，沒有一家企業能夠在所有行業取得成功，而且很難有企業能拿到全行業的數據；而 C 端必然碎片化，由于中國市場的付費習慣，其實同海外有非常大的差别，中國用户的免費習慣是非常明顯的，所有給 C 端用户提供服務的企業必然是以免費模式為主，VIP 模式為輔。

" 大潮将起，落地為王。我們希望這一波通用人工智能的創業浪潮、投資浪潮能夠和上一波不太一樣，可以更快地落地、產生用户和收入。" 方漢的理論依然偏向大模型的商業化。他提到，昆侖萬維研發的 AI 生成音樂產品已經落地文旅場景，今年 4 月與北京東城區籤署協定。

中國電信集團大數據和 AI 中心副總經理張鑫，則在現場公布了其研發的 TeleChat 大模型，支持輸出代碼、寫演講稿等。張鑫提到，電信數科公司研發目标是打造萬級 AI 算法艙，以成為百億級 AI 服務商，產品涵蓋 AI 算法、平台、應用、硬體、大模型等。

這是中國電信首次對外公布其大模型產品。張鑫還稱，相對于其他大模型，TeleChat 產品使用的大部分是國内中文大數據，數據 90% 都是國内為主，而且基于中國電信天翼雲和雲網融合底座，TeleChat 做模型訓練參數的時候，能力能夠達到 47%，而且模型訓練的效率、模型算法能力還在不斷提升。

在應用場景中，中國電信的 TeleChat 大模型已經開始廠商智能化，解決一些語音接線員的人才緊缺和覆蓋不足問題。通過 AI 技術提升，實現社會治理能力的現代化，減少成本消耗。

雲知聲創新事業部副總裁郭凡曾提到，由雲知聲和北京友誼醫院共同開發的基于山海大模型的門診病歷生成系統示範應用，在智慧醫療領網域，基于雲知聲 700 億參數規模的自研 " 山海 " 大模型，結合前端聲音信号處理、聲紋識别、語音識别、語音合成等全棧式智能語音互動技術，預計可提升醫生的電子病歷錄入效率超過 400%，節約單個患者問診時間超過 40%，提升醫生門診效率超過 66%。

實際上，大模型是典型赢家通吃領網域。需要更多的錢，需要更多的算力，以及更優秀人才。因為更好的算力意味着更多人用，更多人用意味着更多數據，更多數據意味着更好的算力結果。大模型必然是巨頭必争之地，巨頭有錢，有技術，更重要是有數據。

而創業公司項目太多，資金過于分散，尤其在企業端最終都變成了消耗資金買英偉達 A100 卡、買雲服務，沒有一個量化的企業發展流程。尤其在 AI 公司、SaaS 公司普遍盈利難、造血難之下，初創公司需要進行大模型商業化、盈利化。

所以，目前國内 AI 大模型正在形成的是以阿裏、騰訊、百度、華為、商湯等大公司建立的通用大模型基座以及算力中心，以及包括毫末智行、天眼查、雲知聲、中科聞歌、曠視等公司建立的垂直或行業領網域大模型，只專注于一兩個領網域解決核心問題。

政府支撐大模型場景落地

本次論壇上，北京市經信局再次公布了北京市通用人工智能產業創新夥伴計劃第二批成員，有 63 家企業入選。

據了解，截至 6 月 30 日，共有 416 家京内外大模型研發和應用企業申請加入第二批 " 夥伴計劃 "。最終，包括北京百度網訊科技有限公司、中電數據服務有限公司、北京集智未來人工智能產業創新基地有限公司等 63 家企業入選并公布。其中，算力夥伴 10 家，數據夥伴 10 家，模型夥伴 10 家，應用夥伴 24 家、投資夥伴 9 家。此外，評估出模型觀察員 30 家。

據钛媒體 App 估算，截至目前已經有超過 80 家公司和機構，入選到了北京市通用人工智能產業創新夥伴計劃當中。

目前，北京正快速推進 AI 大模型建設和產業布局工作。

5 月 21 日，北京市人民政府印發《北京市加快建設具有全球影響力的人工智能創新策源地實施方案（2023-2025 年）》的通知，到 2025 年，北京人工智能技術創新與產業發展進入新階段，基礎理論研究取得突破，原始創新成果影響力不斷提升，而且人工智能產業規模持續提升，形成具有國際競争力和技術主導權的產業集群。

5 月 23 日，北京市人民政府辦公廳印發《北京市促進通用人工智能創新發展的若幹措施》的通知，要求充分發揮政府引導作用和創新平台催化作用，整合創新資源，加強要素配置，營造創新生态，重視風險防範，推動北京市通用人工智能實現創新引領和理性健康發展。

钛媒體 App 在現場注意到，關于 AI 大模型在政務領網域的落地案例和企業參與者越來越多，阿裏、華為、汽車之家、值得買科技等公司均在參與。

北京市政務服務管理局一位負責人在現場演講中提到，為了支撐平台 " 京策 " 建設，政府需要在場景領網域進行通用大模型技術落地，從而提升政策規範管理和精準服務能力。" 對海量市民訴求數據進行深度挖掘分析，為領導決策、基層治理、城市治理提供更有力支撐。"

上述負責人提到，場景推進方面，先期會使用開放的小接口模式，後續會開展私有化的深度應用。長期來看，他們将在數據安全可控的條件下，通過建立數字保護機制和技術評價，來開放高質量可信的政務數據集。

中科聞歌交付中心負責人王璋盛在和钛媒體 App 交流中提到，政府類客户對于 AI 大模型的訴求是很高的，該領網域在大模型應用中也需要數據安全、數據治理等條件，尤其進行高質量數據訓練，從而更好解決該領網域的實際應用問題。

蜜度 CTO 劉益東對钛媒體 App 表示，公司去年開始使用華為雲基礎設施產品展開政務、媒體等領網域的業務落地，如今該公司即将發布專注于網絡輿論的垂直行業大模型產品。

" 政府開始買單‘大模型’，一方面是政策引導和實際應用場景訴求，另一方面是企業自身需要通過大模型來解決成本問題、商業化問題。" 一位行業人士向钛媒體 App 分析，國内大模型行業正在回到 AI 企業與政府結合形成商業化、拿政府補助的時期。

姜廣智表示，當前，北京正加快推進國家新一代人工智能創新發展試驗區和國家人工智能創新應用先導區建設，打造具有全球影響力的人工智能創新策源地，具體措施包括以下三點：

一是加強政策創新和标準引領。解決數據數量相對匮乏、質量難以保證、采集标注成本高及合規使用等問題。籌劃出台 " 算力券 " 政策，支持基于落地應用場景的中小企業獲取多元化、低成本優質算力，支持本市人工智能企業與相關行業組織在人工智能國家标準、行業标準、地方标準制定中發揮引領作用，參與模型性能、數據安全、隐私保護等方面的技術标準制定。

二是加大場景開放力度、率先落地标杆應用。推動本市政府機關、事業部門、國有企業等具有管理公共事務職能的組織積極采購和使用安全、可靠的大模型相關產品和服務，在政務服務、智慧城市等領網域率先落地應用，提升城市治理能力現代化水平。

三是推動夥伴計劃走深走實。目前夥伴計劃中，有 10 餘家算力夥伴計劃提供不少于 4000P 低成本優質算力，供北京市人工智能中小企業開展大模型訓練和推理。10 個數據夥伴開放 18 個、近 500T 高質量數據集供大模型企業訓練使用。同時，也将加快推動大模型行業應用落地，深入發揮夥伴計劃這一市場化對接合作平台的作用，營造北京市大模型創新合作、應用落地的良好生态。

姜廣智強調，北京市經信局将不斷加強優質資源要素配置，有效整合創新資源，積極營造創新生态，夯實人工智能產業發展基礎。

" 大模型不是一家企業能夠做出來的，最好是大家在算力、模型、數據這些層面形成幾個大的生态，尤其是在政府部門的指導下，企業能夠在生态中形成夥伴關系，這樣大家更多是合作而不是競争。未來，大模型可能會形成有生态，有夥伴，大家一起共赢的關系。" 君聯資本執行董事紀海泉表示。

（本文首發钛媒體 App，作者｜林志佳）

更多精彩内容，關注钛媒體微信号（ID：taimeiti），或者下載钛媒體 App