今天小編分享的互聯網經驗:“AI版Office”年營收過億,李開復:PMF已經過時了,歡迎閲讀。
文|周鑫雨
編輯|蘇建勳
時隔半年,李開復再次以 CEO 的身份站在了大模型獨角獸 " 零一萬物 " 的發布會現場。
上一次李開復現身零一萬物發布會現場,還是在 2023 年 11 月 16 日。彼時,零一萬物首次秀了一把大模型肌肉:将中英雙語大模型 "Yi" 開源。
李開復的出現,往往标志着零一萬物新階段的開啓。顯然,用開源模型打磨半年後,零一萬物走進了拼產品和商業化的新戰場。
在大模型側,開源只能作為口碑獲客的入口,商業化的飛輪只能靠閉源正式開啓。發布會上,零一萬物發布了首款千億參數的閉源模型 Yi-Large。在 Benchmark 上,Yi-Large 的 6 項指标優于 GPT-4。
不過,如今的零一萬物将商業化的厚望,寄托在了產品端。
發布會上,零一萬物正式對外推出 AI 生產力應用 " 萬知 ",李開復稱其為 "AI-First 版 Office"。這一款產品,在 2023 年九月已經在海外率先試水,在全球積累了數千萬用户。
李開復表示,在 AI 生產力這個單一產品線上,今年能產生的營收可以達到1 億人民币。
如今,零一萬物呈現在大眾面前的業務版圖,是開源 + 閉源、ToB+ToC、出海 + 本土兩手抓的 " 雙軌 "。
1
業務的版圖,折射的是李開復對技術信仰和市場落地 " 既要又要 " 的經營觀。他認為,兩方的觀念都對,但并不完整。
在此基礎上,他認為 AI 技術公司最重要的,是驗證TC-PMF。T 為技術,C 為成本,PMF 則是產品與市場需求的适配度。
在李開復看來,TC-PMF 的反面教材,就是 OfO 這樣的燒錢打法,產品、技術、成本相互脱節,并沒有找到 " 黃金配比 "。也正是為了驗證 TC-PMF,零一萬物選擇先在海外用高性能模型的 API 試水 " 萬知 ",時隔 9 個月後才在國内上線。
當然,作為零一萬物的 CEO,李開復也有了新的變化。為了跟上短視頻時代的傳播新趨勢,這位 " 中國 AI 模型最高齡創業者 " 開通了抖音賬号,科普怎麼用 AI。連這次的發布會,也選擇在抖音上直播。
不過,李開復也有自己的堅持。比如,不做直播帶貨,只做 AI 科普。再比如,他也對投資人承諾,自己創業," 十年不套現 "。
閉源模型 6 項指标超過 GPT-4,成本僅後者 1/3
2023 年,零一萬物切入大模型戰局的方式是開源。自 2023 年 11 月 6 日以來,零一萬物開源了 6B、9B、34B 三種尺寸的 Yi 大模型。
在本次發布會上,零一萬物增強了開源模型的能力,同時首次發布了閉源模型 Yi-Large。
Yi-Large 是零一萬物對标 GPT-4 所訓練的千億參數規模模型。在最新出爐的斯坦福評測機構 AlpacaEval 2.0 經官方認證的模型排行榜上,Yi-Large 模型的英語能力主要指标 LC Win Rate(控制回復的長度) 僅次于 GPT-4 Turbo。
在中文榜單 SuperCLUE 對中文能力的測評上,Yi-Large 跻身國產模型的榜首,在多項選擇題(GPQA)、人類對齊(AlignBench)等 6 項數據集的評測上超過 GPT-4。
斯坦福評測機構 AlpacaEval 2.0 模型排行榜。
SuperCLUE 排行榜。
與此同時,零一萬物也開啓了自己首個 MoE(混合專家架構)大模型 Yi-XLarge 的訓練。目前在 MMLU、GPQA、HumanEval、MATH 等權威 Benchmark 上,處于訓練初期的 Yi-XLarge,性能已經超過 Yi-Large,并且與 Claude-3-Opus、GPT4-0409 等海外主流模型相比,已有上擂台的資格。
Yi-XLarge 測評結果。
而在開源梯隊上,零一萬物将 34B、9B、6B 三款模型更新到了 Yi-1.5 版本,并提供了 Base(預訓練版)和 Chat(微調版)兩個版本。
1.5 版本的 Yi,主要在數學和代碼的短板上下了功夫。經過微調後,Yi-1.5-6B/9B-Chat 在 GSM-8K 和 MATH 等數學能力評測集、HumanEval 和 MBPP 等代碼能力評測集上,表現甚至優于 Llama-3-8B。Yi-1.5-34B-Chat 的代碼能力則與 Mistral-8x22B-Instruct-v0.1 持平。
在模型服務層面,零一萬物發布了 Yi-Large 的 6 種不同尺寸、性能的模型 API:
Yi-Large API:優勢在于文本生成及推理性能,适用于復雜推理、預測,深度内容創作等場景;
Yi-Large-Turbo API:根據性能和推理速度、成本,進行了平衡性高精度調優,适用于全場景、高品質的推理及文本生成等場景;
Yi-Medium API:優勢在于指令遵循能力,适用于常規場景下的聊天、對話、翻譯等場景;
Yi-Medium-200K API:可一次性解讀 20 萬字文本,适用于超長内容文檔處理場景;
Yi-Vision API:具備高性能圖片理解、分析能力,可服務基于圖片的聊天、分析等場景;
Yi-Spark API:聚焦輕量化極速響應,适用于輕量化數學分析、代碼生成、文本聊天等場景。
在 API 定價層面,零一萬物 API 平台負責人藍雨川表示,Yi-Large API 目前的定價為 20 元 /100 萬 Tokens,這個數字不到 GPT-4 Turbo(定價 10 美元 /100 萬 Tokens)的 1/3。
零一萬物 API 負責人藍雨川透露,未來,零一萬物也可能照着雲平台的思路,提供 API 工具和行業解決方案。
"AI 版 Office" 發布,支持手機上一句話生成 PPT
單一產品 2024 年收入達 1 億人民币,產品 ROI 接近 1,上線 9 個月,用户數近千萬。
在揭曉應用前,李開復先用了一組頗為漂亮的海外成績單,宣告產品在海外對 PMF(產品市場匹配度)的初步驗證。
有了這份海外成績單,零一萬物在國内上線了首款應用產品 " 萬知 "。這款應用的定位是生產力工具,李開復稱之為 "AI-First 版 Office"。
基于海外驗證的結果,零一萬物生產力產品負責人曹大鵬發現,原有以空白文檔開啓工作流的工具已經滿足不了用户的需求,用户想要的辦公產品,需要CUI(Chat UI,聊天界面)和 GUI(Graphic UI,影像界面)的結合。
除了最基礎的對話式搜索能力外,萬知的多模理解能力,可以支持各種圖表形式的結果生成。
比如思維導圖:
再比如 PPT 生成:
同時,萬知也支持圖表解析和長文檔理解。比如,我們用零一萬物發布會的速記稿牛刀小試,做一個重點總結:
萬知還能從文檔中搜索到零一萬物生產力產品負責人的信息:
區别于 WPS 和 Windows AI Copilot,萬知在網頁版之外,推出了微信小程式端的應用,實現了 " 多端協同 "。用户在通勤等碎片化的時間裏,也可以用手機快速處理 PPT,并且能将工作進程同步到 PC 端。
用未來的技術,做當下的產品
李開復對零一萬物這一年的總結是:狂奔着趕上了美國最先進的模型。而如今,他覺得,大模型廠商要思考怎麼進入 " 長跑模式 "。
TC-PMF,是他思考的結果。當產品處于 0-1 階段,企業要考慮的是獲客和提高粘性;而到了 1-100 的階段,任何產品想要實現大規模應用,需兼顧技術路徑和推理成本。
零一萬物模型訓練負責人黃文灏表示,Scaling Law 給 AGI 指明了方向,當到了應用落地階段,模型的優化目标是給定計算條件下的計算水平,提高 Infra 對計算效率的提升,以及提高訓練數據的質量。
這也對大模型廠商的人才團隊建設,提出了更高的要求。黃文灏認為,模型公司競争力 = 人才質量 × 算力,TC-PMF 的驗證更需要算法、Infra、工程三位一體的人才。
為了實現 TC-PMF,零一萬物總結了 3 個方法論:
全球化布局:知己知彼,把控區網域商業節奏。比如用户量較大的 To C AI 應用,主要集中在歐美;
模基共建:模型的訓練 / 服務 / 推理設計,與底層 Infra 架架構和模型結構必須高度适配;
模應一體:真實用户體驗,和模型迭代形成正循環。
回到做產品的層面,一年以來,李開復見證了不少應用,在 OpenAI 等巨頭的技術迭代中淪為炮灰:" 和抖音時代不一樣的是,今天的模型在非常快速地基于 Scaling Law 在推進,GPT-4 出來已經改寫了基于 GPT-3.5 的應用所具有的能力,所以要不斷預測未來技術會怎麼走。"
"做一個產品,不能考慮今天的技術,而是要考慮未來的技術。" 他總結。
歡迎交流!