“AI版Office”年營收過億，李開復：PMF已經過時了

今天小編分享的互聯網經驗：“AI版Office”年營收過億，李開復：PMF已經過時了，歡迎閱讀。

文｜周鑫雨

編輯｜蘇建勳

時隔半年，李開復再次以 CEO 的身份站在了大模型獨角獸 " 零一萬物 " 的發布會現場。

上一次李開復現身零一萬物發布會現場，還是在 2023 年 11 月 16 日。彼時，零一萬物首次秀了一把大模型肌肉：将中英雙語大模型 "Yi" 開源。

李開復的出現，往往标志着零一萬物新階段的開啟。顯然，用開源模型打磨半年後，零一萬物走進了拼產品和商業化的新戰場。

在大模型側，開源只能作為口碑獲客的入口，商業化的飛輪只能靠閉源正式開啟。發布會上，零一萬物發布了首款千億參數的閉源模型 Yi-Large。在 Benchmark 上，Yi-Large 的 6 項指标優于 GPT-4。

不過，如今的零一萬物将商業化的厚望，寄托在了產品端。

發布會上，零一萬物正式對外推出 AI 生產力應用 " 萬知 "，李開復稱其為 "AI-First 版 Office"。這一款產品，在 2023 年九月已經在海外率先試水，在全球積累了數千萬用戶。

李開復表示，在 AI 生產力這個單一產品線上，今年能產生的營收可以達到1 億人民币。

如今，零一萬物呈現在大眾面前的業務版圖，是開源 + 閉源、ToB+ToC、出海 + 本土兩手抓的 " 雙軌 "。

業務的版圖，折射的是李開復對技術信仰和市場落地 " 既要又要 " 的經營觀。他認為，兩方的觀念都對，但并不完整。

在此基礎上，他認為 AI 技術公司最重要的，是驗證TC-PMF。T 為技術，C 為成本，PMF 則是產品與市場需求的适配度。

在李開復看來，TC-PMF 的反面教材，就是 OfO 這樣的燒錢打法，產品、技術、成本相互脫節，并沒有找到 " 黃金配比 "。也正是為了驗證 TC-PMF，零一萬物選擇先在海外用高性能模型的 API 試水 " 萬知 "，時隔 9 個月後才在國内上線。

當然，作為零一萬物的 CEO，李開復也有了新的變化。為了跟上短視頻時代的傳播新趨勢，這位 " 中國 AI 模型最高齡創業者 " 開通了抖音賬号，科普怎麼用 AI。連這次的發布會，也選擇在抖音上直播。

不過，李開復也有自己的堅持。比如，不做直播帶貨，只做 AI 科普。再比如，他也對投資人承諾，自己創業，" 十年不套現 "。

閉源模型 6 項指标超過 GPT-4，成本僅後者 1/3

2023 年，零一萬物切入大模型戰局的方式是開源。自 2023 年 11 月 6 日以來，零一萬物開源了 6B、9B、34B 三種尺寸的 Yi 大模型。

在本次發布會上，零一萬物增強了開源模型的能力，同時首次發布了閉源模型 Yi-Large。

Yi-Large 是零一萬物對标 GPT-4 所訓練的千億參數規模模型。在最新出爐的斯坦福評測機構 AlpacaEval 2.0 經官方認證的模型排行榜上，Yi-Large 模型的英語能力主要指标 LC Win Rate（控制回復的長度）僅次于 GPT-4 Turbo。

在中文榜單 SuperCLUE 對中文能力的測評上，Yi-Large 跻身國產模型的榜首，在多項選擇題（GPQA）、人類對齊（AlignBench）等 6 項數據集的評測上超過 GPT-4。

斯坦福評測機構 AlpacaEval 2.0 模型排行榜。

SuperCLUE 排行榜。

與此同時，零一萬物也開啟了自己首個 MoE（混合專家架構）大模型 Yi-XLarge 的訓練。目前在 MMLU、GPQA、HumanEval、MATH 等權威 Benchmark 上，處于訓練初期的 Yi-XLarge，性能已經超過 Yi-Large，并且與 Claude-3-Opus、GPT4-0409 等海外主流模型相比，已有上擂台的資格。

Yi-XLarge 測評結果。

而在開源梯隊上，零一萬物将 34B、9B、6B 三款模型更新到了 Yi-1.5 版本，并提供了 Base（預訓練版）和 Chat（微調版）兩個版本。

1.5 版本的 Yi，主要在數學和代碼的短板上下了功夫。經過微調後，Yi-1.5-6B/9B-Chat 在 GSM-8K 和 MATH 等數學能力評測集、HumanEval 和 MBPP 等代碼能力評測集上，表現甚至優于 Llama-3-8B。Yi-1.5-34B-Chat 的代碼能力則與 Mistral-8x22B-Instruct-v0.1 持平。

在模型服務層面，零一萬物發布了 Yi-Large 的 6 種不同尺寸、性能的模型 API：

Yi-Large API：優勢在于文本生成及推理性能，适用于復雜推理、預測，深度内容創作等場景；

Yi-Large-Turbo API：根據性能和推理速度、成本，進行了平衡性高精度調優，适用于全場景、高品質的推理及文本生成等場景；

Yi-Medium API：優勢在于指令遵循能力，适用于常規場景下的聊天、對話、翻譯等場景；

Yi-Medium-200K API：可一次性解讀 20 萬字文本，适用于超長内容文檔處理場景；

Yi-Vision API：具備高性能圖片理解、分析能力，可服務基于圖片的聊天、分析等場景；

Yi-Spark API：聚焦輕量化極速響應，适用于輕量化數學分析、代碼生成、文本聊天等場景。

在 API 定價層面，零一萬物 API 平台負責人藍雨川表示，Yi-Large API 目前的定價為 20 元 /100 萬 Tokens，這個數字不到 GPT-4 Turbo（定價 10 美元 /100 萬 Tokens）的 1/3。

零一萬物 API 負責人藍雨川透露，未來，零一萬物也可能照着雲平台的思路，提供 API 工具和行業解決方案。

"AI 版 Office" 發布，支持手機上一句話生成 PPT

單一產品 2024 年收入達 1 億人民币，產品 ROI 接近 1，上線 9 個月，用戶數近千萬。

在揭曉應用前，李開復先用了一組頗為漂亮的海外成績單，宣告產品在海外對 PMF（產品市場匹配度）的初步驗證。

有了這份海外成績單，零一萬物在國内上線了首款應用產品 " 萬知 "。這款應用的定位是生產力工具，李開復稱之為 "AI-First 版 Office"。

基于海外驗證的結果，零一萬物生產力產品負責人曹大鵬發現，原有以空白文檔開啟工作流的工具已經滿足不了用戶的需求，用戶想要的辦公產品，需要CUI（Chat UI，聊天界面）和 GUI（Graphic UI，影像界面）的結合。

除了最基礎的對話式搜索能力外，萬知的多模理解能力，可以支持各種圖表形式的結果生成。

比如思維導圖：

再比如 PPT 生成：

同時，萬知也支持圖表解析和長文檔理解。比如，我們用零一萬物發布會的速記稿牛刀小試，做一個重點總結：

萬知還能從文檔中搜索到零一萬物生產力產品負責人的信息：

區别于 WPS 和 Windows AI Copilot，萬知在網頁版之外，推出了微信小程式端的應用，實現了 " 多端協同 "。用戶在通勤等碎片化的時間裡，也可以用手機快速處理 PPT，并且能将工作進程同步到 PC 端。

用未來的技術，做當下的產品

李開復對零一萬物這一年的總結是：狂奔着趕上了美國最先進的模型。而如今，他覺得，大模型廠商要思考怎麼進入 " 長跑模式 "。

TC-PMF，是他思考的結果。當產品處于 0-1 階段，企業要考慮的是獲客和提高粘性；而到了 1-100 的階段，任何產品想要實現大規模應用，需兼顧技術路徑和推理成本。

零一萬物模型訓練負責人黃文灏表示，Scaling Law 給 AGI 指明了方向，當到了應用落地階段，模型的優化目标是給定計算條件下的計算水平，提高 Infra 對計算效率的提升，以及提高訓練數據的質量。

這也對大模型廠商的人才團隊建設，提出了更高的要求。黃文灏認為，模型公司競争力 = 人才質量 × 算力，TC-PMF 的驗證更需要算法、Infra、工程三位一體的人才。

為了實現 TC-PMF，零一萬物總結了 3 個方法論：

全球化布局：知己知彼，把控區網域商業節奏。比如用戶量較大的 To C AI 應用，主要集中在歐美；

模基共建：模型的訓練 / 服務 / 推理設計，與底層 Infra 架架構和模型結構必須高度适配；

模應一體：真實用戶體驗，和模型迭代形成正循環。

回到做產品的層面，一年以來，李開復見證了不少應用，在 OpenAI 等巨頭的技術迭代中淪為炮灰：" 和抖音時代不一樣的是，今天的模型在非常快速地基于 Scaling Law 在推進，GPT-4 出來已經改寫了基于 GPT-3.5 的應用所具有的能力，所以要不斷預測未來技術會怎麼走。"

"做一個產品，不能考慮今天的技術，而是要考慮未來的技術。" 他總結。

歡迎交流！