今天小編分享的互聯網經驗:智譜AI給中國大模型公司的商業化打了樣,歡迎閱讀。
" 人工智能本就是一個綜合性學科,如果研究的成果不能很快被應用,它的價值很可能被遺忘。所以在 KEG,我們會把研究和工程放在相對平等的位置上。這個風格也延續到我們出來做公司。"
去年 10 月,智譜 AI CEO 張鵬在 ChatGLM3 發布前後的一次媒體采訪中說。這家由清華大學知識工程實驗室(KEG)孵化的人工智能公司在同月發布的這款基座模型,性能上開始追平 GPT-3,甚至看向 GPT-4。在整個 2023 年,智譜 AI 累計獲得超 25 億元融資,也成為國内估值最高的大模型公司之一。
2023 年 3 月 14 日,智譜 AI 發布了 ChatGLM 系列的第一款基座模型。回頭來看,這個日子或許是生成式 AI 的重要一天。這一天内,OpenAI 發布了 GPT-4,同根同源的競争者 Anthropic 發布了 Claude,谷歌推出了對抗 OpenAI 和微軟組合的 PaLM API 服務,而新銳的 Midjourney 發布了 V5。
一年時間足夠讓生成式 AI 從一場技術奇觀轉入一個商業化的初期階段。
ChatGP 和 Claude 首先迅速轉入訂閱制,同時放出了 API 調用的定價模式。微軟 Azure 雲服務中目前 53000 左右的客戶數量中,有 1/3 來自最近 12 個月,而這幾乎完全歸功于 OpenAI。
相比于 OpenAI,缺少微軟這個天然用戶池的 Anthropic 更堅決地走向了企業客戶。科技公司 Gitlab、Notion、Quora 和 Salesforce;金融巨頭橋水公司(Bridgewater)和企業集團 SAP,以及商業研究門戶網站 LexisNexis、電信公司 SK Telecom 等行業的響亮名字都出現在 Anthropic 的客戶名單上。"Anthropic 更像是一家企業公司,而不是一家消費者公司。"Anthropic 聯合創始人達裡奧 · 阿莫迪和丹妮拉 · 阿莫迪兄妹在 Claude 3 發布時強調了這一點。
在國内的大模型初創公司中,智譜 AI 或許是最早開始商業化的。它在產品和生态的布局上有幾分像 OpenAI,而在落地的思路上又多了些 Anthropic 的影子。
距離 2023 年 3 月 14 日已經一年,智譜 AI 背後商業化生态的圖景已經展開。
逐漸成型的生态
Sora 出現的時候,張鵬并不驚訝。在他看來,Sora 只是 OpenAI 技術領先的又一次驗證,只不過他用一種更直觀的方式把這個差距具像化了。就像 2022 年末的 ChatGPT 一樣。
張鵬曾談到對智譜 AI 產生重要影響的時刻,其中的一個時刻是 ChatGPT 的發布。
其實在 ChatGPT 之前,InstructGPT 和 WebGPT 等技術我們一直有,也預感到基于 GPT-3 這樣一個優秀千億基座的智能應用會迎來爆發。但 ChatGPT 的上線給我們一個明顯信号:預訓練模型已經到了完全可使用且好用的階段,是產品化的很好範例。
OpenAI 在基礎模型的性能層面不斷演進,以 ChatGPT 驚豔亮相在大眾視線之後,逐漸變成了一家非常緊湊的產品公司。而對标 OpenAI 的智譜 AI,有意在產品化上跟住 OpenAI 的節奏。
圖源:智譜 AI
從基礎模型 GLM 和 API 能力的開放,到對話模型 ChatGLM 和代碼模型 CodeGeeX,以及多模态方面從 2021 年開始布局的文生視頻模型 CogVideo。以張鵬的話來說,智譜 AI 在產品線上與 OpenAI 做了 " 全線的對标 "。但這種對标并不是不加思考地跟随,而是在 AGI 的一致目标下有着相似的技術積累階段。
在 OpenAI 發布 GPTs 的那場開發者大會上,CEO 山姆 · 奧特曼公布了一組數據。圍繞着 OpenAI 豐富的產品能力,已經有大約 200 萬開發人員在其 API 上構建各種各樣的應用,超過 92% 的全球 500 強企業正在使用其產品,ChatGPT 的周活躍用戶則達到大約 1 億。
而随着 GLM-4 的發布,智譜 AI 背後的多重生态也開始成型。
2024 年初,智譜 AI 在首屆 AI 技術開放日 DevDay 上發布了最新的基座大模型 GLM-4。第一批體驗到 GLM-4 模型的人是大量熱忱的開發者,随着 GLM-4 在性能上開始接近 GPT-4,構建 AI 應用生态的那個爆發點看起來也呼之欲出。對标 OpenAI 的 GPTs,智譜 AI 在 DevDay 上發布了 GLMs。
GLMs 是智譜 AI 在基礎模型進入一個成熟階段後對于開發者生态的一次加碼。但在 GLMs 之前,智譜 AI 很早開始布局的開源路線到現在已經聚攏起一大批開發者。
在對于大模型的共識還沒有形成之前,開源是智譜 AI 介紹自己的方式。" 為了讓大家知道智譜在做什麼。也是為了讓更多的人參與進大模型,用社區的方式、匯集大家的熱情一起來推動大模型發展。" 張鵬說。
早在 2022 年 8 月,智譜 AI 就開源了 1300 億參數規模的雙語預訓練模型 GLM-130B,并且收到了 70 餘個國家 1000 餘個研究機構的使用需求。今年 3 月與基座模型 ChatGLM 同步,智譜 AI 開源了單卡版模型 ChatGLM-6B。截至今天,ChatGLM-6B 到目前為止累計的全球下載量已經超過 1300 萬,在 github 上新數已經達到 5 萬,在量級上已經超過 Meta 的知名的 LlaMA 兩個版本的總和。
智譜 AI 也在去年獲得了 HuggingFace 全球最受歡迎開源機構排名的第五名,高于 OpenAI 和谷歌,也是唯一上榜的中國機構和組織。
随着 GLM-4 的發布,智譜 AI 同時發起了一項大模型開源基金。智譜 AI 将為大模型開源社區提供一千張卡,助力開源開發;提供 1000 萬元的現金用來支持與大模型相關的開源項目;為優秀的開源開發者提供 1000 億免費 API tokens。智譜 AI CEO 張鵬表示,大模型開源基金的目的在于推動大模型研發的大進展,促進大模型整個開源生态的大繁榮。
值得一提的是,在智譜 AI 眾多開源模型中,ChatGLM-6B 和 ChatGLM2-6B 權重對學術研究完全開放,并且在完成企業登記獲得授權後允許免費商業使用。智譜 AI 對學術生态的重視可見一斑。
豐富的產品生态,開源道路的努力,開始逐漸成為智譜 AI 通往商業化的橋梁。
從生态通往商業
去年 3 月,微軟宣布了 Office365 Copilot,Adobe 則在幾乎同時推出了 AI 工具 Firefly。一切都預示着大模型的落地會成為生產力工具的一次再造。包括 WPS 在内主要產品月活設備接近 6 億的金山來說,這是一場必須趕上的變革。
去年 7 月,金山辦公的 WPS AI 逐步開放全新 AI 功能測試體驗,背後智譜 AI 的 GLM 大模型支撐着 WPS 在 Word、PPT 等產品線的智能化更新。
通過集成智譜 AI 的 GLM 大模型,WPS AI 不僅能夠根據用戶的簡要輸入快速生成規範的文檔内容,如紅頭檔案、會議紀要等,還能在政府辦公領網域提供輔助寫作服務,支持多種公文體裁,極大地提升了文檔處理的效率和專業性。
圖源:WPS
WPS AI 在 PPT 演示文檔的制作上也展現了其強大的功能,用戶只需提供主題,AI 便能自動完成從大綱到内容的創作,甚至包括演講稿的撰寫,以及 PPT 的排版工作,極大地簡化了用戶的操作流程。這一創新舉措不僅節省了寶貴的時間,也使得用戶能夠更加專注于内容的創意和表達。
金山辦公通過開放平台 API 調用 GLM 大模型,并結合自身豐富的場景需求描述及模板,構建了一套高效的測試集。智譜 AI 的 GLM 大模型在核心辦公場景中展現出卓越的性能,為金山辦公的產品線注入了新的活力。根據用戶反饋,WPS AI 的用戶滿意度已超過 95%。
不止工作流層面的變革,智譜 AI 的商業化生态已經開始積累出不同層次。
德勤中國,作為一家為本地及跨國企業提供綜合性服務的機構,面臨着将大量文檔資料轉化為可操作信息的挑戰。傳統的工作流程中,顧問們需要手動篩選關鍵數據,撰寫報告草稿,這一過程不僅耗時,而且對顧問的專業水平要求較高,容易出現遺漏和錯誤。
為了提高效率和準确性,德勤中國引入了基于智譜 AI 的 GLM 大模型的報告生成智能助手。該助手通過雲私有部署的方式,允許用戶上傳多種格式的文檔資料,然後智能地進行文檔解析、數據切分和信息提取。在報告撰寫環節,智能助手能夠根據預設的規範格式,自動生成報告草稿,顯著減少了人工撰寫的時間和勞動強度。
此外,智能助手還集成了快捷翻譯功能,解決了報告撰寫過程中的語言障礙問題,提高了翻譯的效率和質量。這一改進不僅加快了報告的生成速度,也降低了翻譯和復核的成本,同時提高了信息的準确性和報告的專業度。從德勤中國的使用反饋來看,GLM 大模型在中文環境下表現出了超出同類模型的能力,整體員工效率提升了 10% 左右。
而在 C 端,智譜 AI 幫助馬蜂窩打造了 AI 小螞應用,這個有着海量用戶和旅行内容數據的旅行社交平台,亟需這樣一位能為用戶提供出行資訊服務的 " 導遊 "。
圖源:智譜 AI
在大模型的加持下,AI 小螞能夠理解用戶的個性化、多樣化的意圖,并提供精準的問題回答和個性化的内容服務。此外,它還能夠結合歷史對話信息和指代信息進行語義補全,使對話内容更具連續性。甚至從歷史對話中抽取關鍵信息,如 POI(興趣點)、天氣信息等,建立用戶行程信息庫,用于後續的對話回憶、問題引導和精準回答。
通過智譜 AI 的技術賦能,馬蜂窩的 AI 小螞應用不僅提高了用戶獲取旅行信息的效率,還增強了平台的互動性和個性化服務能力。
在此之前,全球知名的旅行 Booking.com 在去年年中推出了 AI 對話功能 AI Trip Planner,背後提供技術支持的是 OpenAI 的 ChatGPT API。測試版 AI Trip Planner 從當地時間 6 月 28 日開始向美國 Booking.com 的 Genius 忠誠會員推出。最初只能在該 OTA 的 App 中訪問,但該公司計劃将來将其擴展到 PC 端軟體中。
一條自己的道路
大模型在真實商業世界中的落地并不會是一場對舊世界完全的颠覆,更多是從 AI 小螞、AI Trip Planner 這樣滲透式的變化開始。而對于智譜 AI 來說,要在國内作為一家 " 企業公司 " 站穩腳跟,需要找到一個與國際同行不同的商業化路徑。
" 到目前為止,我們現在有三種方式來實現這樣一個商業化落地。" 張鵬表示。
第一種是最輕量級的,也就是完全标準化的 API 調取。" 我們把我們的模型封裝成開放平台,提供 API 的方式給我們的開發者、企業去進行調用,按照調用量進行付費,這種商業模式非常簡單、成熟,就看使用量。"
不過雖然生成式 AI 會推動國内 SaaS 市場的進一步成熟,但目前私有化方案仍然是最有效的商業模式。
第二種是當标準化的版本還不能滿足需求的時候,比如客戶需要獨立的數據保障,但同時又不希望自己去維護算力等基礎設施。智譜會提供基于雲端算力的雲端私有化的方案,利用我們自己雲端的算力幫用戶開辟專門的模型的專區,它在使用整個服務過程當中保持數據與其他客戶的相對隔離。
除此之外,中國還有着大量完全私有化的企業需求。國有企業或者是一些非常關注數據安全和保密的行業要求自己的數據、自己的系統不能出自己的物理邊境," 第三種方式就是針對這種情況,以完全私有化落地的方案進入到企業當中,在企業提供的硬體和算力基礎平台上,為大家提供大模型的基座能力,去開發相應的應用和業務的需求滿足。"
在 2023 年 3 月 14 日,這個大模型的重要時間節點一年之後,張鵬再次出現在外界面前。目前智譜 AI 已經與 2000 多家生态合作夥伴建立了合作關系,實現了 1000 多個大模型規模化應用,并與 200 多家企業進行了深度共創。
圖源:智譜 AI
對于這一年内商業化上的進展,張鵬表示這歸功于智譜 AI 對自己邊界的認識。
" 我們非常清楚我們的長項、優勢和目前為止還不太擅長的事情。所以我們的選擇是開放共赢。總有在行業當中摸爬滾打很多年的一些企業、夥伴,他們積累了對這個行業的知識,積累了豐富的實踐經驗,他們非常迫切地想要引入全新的 AI 能力,但他們苦于技術的發展非常快速,也沒有很好的消化時間和周期,不知道如何讓大模型的能力在行業當中進行落地。"
" 反過來,我們對大模型的本質以及如何應用誘發它的能力是更清楚的。" 張鵬表示。
值得一提的是,從今年 1 月智譜 AI 發布 GLMs 以及 " 智能體中心 " 應用商店,至今用戶已經貢獻了超過 20 萬個創新的智能體應用。這 20 萬個智能體的背後是性能強悍的 GLM-4。随着性能的提升,大模型開始從一個新奇的玩具,開始轉向去解決一些工作和生活中的 " 真問題 "。
如果說 2024 年之前,關于大模型的思考仍然是極客式的,關于技術路線和極致的能力。進入 2024 年後,如何找到客戶、如何落地将是每一個大模型公司所面對的 " 真問題 "。但這很大程度上并不是一個 " 如何找到客戶 " 的問題,而是關于 " 如何被客戶選中 "。圍繞 GLMs 聚攏起來的開發者、迅速生長起來的客戶生态,就是一場直接的用腳投票。模型性能的高低,最終會成為大模型公司在商業化競争中的勝負手。
這又回歸到了出身學界的智譜 AI 屢次提到的,樸素的發展道路——在基礎模型的性能上做到領先。
張鵬提到了團隊曾經訓練中的一個細節。在 2021 年左右對大模型的共識遠未像現在這樣廣泛被接受的時候,研發團隊曾經維持了很長一段時間 24/7 的強度。如果凌晨 3 點時候的訓練中有一張卡掉了,研發人員會是最先發現的,并且能夠在 10 分鍾内告知遠程的運維人員。這樣承受巨大壓力的高強度研發了近一年後,智譜 AI 拿出了 GLM-130B。後者是 2022 年 11 月發布的斯坦福大模型中心測評榜單中亞洲唯一入選的大模型。這個千億參數的稠密模型确立了智譜 AI 的位置,也第一次把智譜 AI 大範圍引到全球的客戶面前。
或許在大模型商業化這件事上,技術理想主義是最大的實用主義。