李開復：最新預訓練模型Yi-Lightning超越GPT-4o，中美頂尖模型只差5個月

今天小編分享的互聯網經驗：李開復：最新預訓練模型Yi-Lightning超越GPT-4o，中美頂尖模型只差5個月，歡迎閱讀。

（圖片來源：钛媒體 App 編輯林志佳拍攝）

" 前一陣聲稱國内六家大模型公司裡有幾家放棄了預訓練，我們正式辟謠，零一萬物絕不放棄預訓練，而且我們的預訓練做得又快又好。"

10 月 16 日上午，面對市場的猜測和質疑，零一萬物創始人李開復開宗明義公布這段話，并宣布推出新的旗艦預訓練模型 Yi-Lightning" 閃電模型 "。

據李開復介紹，在國際權威盲測榜單 LMSYS 上，Yi-Lightning 超越 OpenAI GPT-4o-2024-05-13、Anthropic Claude 3.5 Sonnet，排名世界第六，中國第一。他還稱，Yi-Lightning 是 " 頂級模型白菜價 "，在推理速度和價格上，Yi-Lightning 的最高生成速度提速近四成，每百萬 token 僅需 0.99 元，且該定價仍有利潤。

" 它是第一個在國際權威達到非常高排名、打敗多數的美國大模型，成為首度超越全球頭部的 OpenAI GPT-4o 的中國大模型。Yi-Lightning 閃電模型不但模型性能世界一流、推理非常快速，而且價格非常低，不論是 App 調用、還是企業應用場景調用，都是非常适合的。" 李開復表示。

會後交流時，李開復向钛媒體 App 強調，很多人問中國的預訓練是否落後美國？我們也坦誠中國是落後美國，但有人說落後十年、二十年，今天我們可以用非常精确的數字來算，GPT4o 在 5 月做出來的模型，我們在 10 月的今天已經把它打敗了。如果真的算中國趕超美國有多遠的距離，至少，零一萬物離 OpenAI 的模型，只差 5 個月。

據悉，零一萬物（01.AI）成立于 2023 年 5 月 16 日，致力于打造全新的 AI 2.0 平台與 AI-first 生產力應用的全球化公司，由創新工場董事長兼 CEO 李開復創立，并擔任零一萬物 CEO。核心團隊成員來自谷歌、微軟、IBM、百度等公司。

融資層面，截至目前，零一萬物已完成三輪融資，其中包括由阿裡領投的 2.5 億美元（約合人民币 18.08 億元）Pre-A 輪融資，估值已超過 10 億美元，跻身獨角獸行列。（詳見钛媒體 App 前文：《對話李開復：中美大模型差距越來越小，我 10 年不 " 套現 "》）

產品和商業化層面，零一萬物主打國外 To C（消費級）付費市場、國内 To B（企業級）付費市場。

對于 B 端與 C 端的布局，李開復表示，一家大模型公司同時去做 To B 和 To C 很辛苦，需要多元化的管理方式，因為兩個團隊的基因不同，做事方法與衡量 KPI 也不同。To B 領網域，零一萬物目前主要聚焦國内市場，如餐飲領網域的數字人方案；To C 領網域主要布局海外，因為在國内 To C 產品的流量是一個很大的成本問題，在當下較為挑戰的環境下需要謹慎判斷。

其中，C 端領網域，今年 5 月，零一萬物發布 AI 生產力工具 " 萬知 "，可速讀 60 萬字《馬斯克傳》。零一萬物預計今年 To C 端營收預計可達 1 億人民币。

李開復表示，"to C 我們主要布局海外，有幾個理由：第一、當我們開始做零一萬物時國内還沒有合适的中文模型，我們只有在國外先嘗試，嘗試了一段就有了心得，就迭代了一個、兩個、三個產品，這些產品現在表現有些很好，有些沒有那麼好，我們也在不斷地調整中。我們也在觀察什麼時候适合在國内做什麼樣的產品，國内 to C 產品的流量的成本越來越高，我們也看到了有些友商的用戶從十幾塊人民币加到三十多塊人民币，近來還有相當的流失，在這樣一個挑戰環境裡我們會非常謹慎，先不推出中國本土新的 to C 的應用，我們已有的產品還會繼續維護，但更多的精力會在國外的土壤用更低廉的錢買到非常高質量的用戶，或者能直接把 App 賣出去，讓用戶來訂閱收費，這個訂閱的習慣在國外也是比較良好，主要是這幾個理由。現在當下最大的理由還是說國外做 to C 的產品，我們變現能力和消耗用戶增長的成本算賬可以算得過來，以後再關注國内有什麼機會可以推出。"

如今，零一萬物再度選擇優化預訓練模型，并且會上也首度公布了全新 ToB 戰略下的首發行業應用產品 AI 2.0 數字人，聚焦國内零售和電商等 To B 業務場景。

"對于回答的生成都是靠我們 Yi-Lightning 大模型，某酒旅企業 GMV 銷售額直升 170%。我覺得，大模型應用與其說賣模型或模型做客服等應用，最好的是能夠有一個大模型公司看到完整的用戶需求，從端到端打造一個完整的解決方案，讓購買大模型和數字人的公司能立刻看到每一使用就賺錢，用得越多賺得越多，這樣他對我們的付費意願也會增長。" 李開復直言，零一萬物 to B 選擇做國内，是因為找到了一些破局的空間，比如用數字人來做零售、餐飲等，形成一個完整的解決方案，另外還有兩三個領網域開始在做，但現在還不方便披露。

李開復強調，" 全世界的範疇來說，to B 供應商基本都是當地的，跨國的設立分公司做 to B，絕對不是我們或其他的創業公司能做的，所以 to B 在國外就放棄了，做 to B 就做國内，做 to B 就做有利潤的解決方案，而不只是賣模型，不只是做項目制，這是我們 to B 的做法。"

談及成本問題，李開復稱，此次預訓練零一萬物用了 2000 張 GPU，訓練了一個半月，花費了三百多萬美元，但成本約為 Grok 的 1%-2%。

李開復認為，OpenAI 是一家很厲害的公司，已發布的 OpenAI o1 雖然隐藏了所有中間的思考狀态，但 o1 将此前預訓練中的 Scaling 趨勢擴展到推理，對行業形成認知改變，讓行業認識到預訓練之外，後訓練 SFT（Supervised Fine-Tun-ing，監督微調）與強化訓練都非常重要，" 相信很多中美公司都在向 o1 方向狂奔。" 李開復稱。

談及未來行業形勢，李開復強調，公司不會放棄預訓練，但這是個技術活，需要懂芯片、推理、模型、算法 " 如果一家公司能擁有這麼多優秀的人才，能夠跨領網域合作，相信中國可以做出世界排名前十的預訓練通用模型，但由于成本比較高，未來可能會有越來越少的大模型公司做預訓練。

" 中國的六家大模型公司，只要有夠好的人才，想做預訓練的決心，融資額跟芯片都不會是問題的。" 李開復稱。

以下是李開復和钛媒體 App 等部分對話信息：

問：模型做到 " 世界第六，中國第一 "，同時以較低的價格推向市場，是如何實現的？

李開復：零一萬物在 Yi-Lightning 的定價上并沒有虧本。

成立第一天起，零一萬物同時啟動了模型訓練、AI Infra、AI 應用三大團隊，三個團隊成熟後，再對接到一起。零一萬物将這一模式總結為模基共建、模應一體兩大戰略。AI Infra 助力模型訓練和推理，以更低的訓練成本，訓練出性能領先的模型，以更低的推理成本支撐應用層的探索。

我們不會賠錢賣模型，但也不會賺很多錢，而是在成本線上加一點點小小的利潤，就得到了今天 0.99 元 / 百萬 token 的價格。

挑選模型 API 最重要的一點，是模型性能一定要優秀，在這個前提之下才去挑最便宜的，我相信，綜合 Yi-Lightning 的模型質量和價格來看，Yi-Lightning 很可能是很多開發者最認可、最高性價比的模型。

問：此前有消息稱，大模型 " 六小虎 "（零一、智譜、百川、MiniMax、月之暗面、階躍星辰），其中某幾家放棄了預訓練。站在行業的角度，逐步放棄模型預訓練會成為行業整體趨勢嗎？

李開復：做好預訓練模型是一個技術活，而且要非常多有才華的人在一起工作，慢工出細活。需要有懂芯片的人、懂推理的人、懂基礎架構的人、懂模型的人、很好的算法同學，一起做出來。

如果一個公司能有幸擁有這麼多優秀的人才，能夠跨領網域的合作，我相信中國絕對可以做出世界排名前十的預訓練的通用模型，但不是每家公司都可以做這件事情，做這件事情的成本也比較高，以後有可能會越來越少的大模型公司做預訓練。

不過據我所知，這六家公司融資額度都是夠的，我們做預訓練的 production run，訓練一次三四百萬美金，這個錢頭部公司都付得起。我覺得中國的六家大模型公司只要有夠好的人才，想做預訓練的決心，融資額跟芯片都不會是問題的。

問：零一萬物首次公布 ToB 相關矩陣，未來會進一步在 ToB 方向深耕嗎？

李開復：在國内，大模型 ToB 相對于 AI 1.0 時代有不同的打法，首要任務就是要尋找少數能夠按使用情況收費的方法，而不是項目定制的方法。能得到比較高利潤率的訂單再去做。

今天零一萬物推出的 AI 2.0 數字人解決方案不是做一單賠一單的做法，它專注到用戶重大的痛點需求和盈利點，也就是一個店長或 KOL 平時做一次直播浪費最重要的資源——他的時間。這個時間就算做一小時直播能賺到一千塊錢，也就是這一千塊錢，但如果用數字人直播就不是一小時了，可能可以做一千個小時（直播），哪怕每一個小時只能賺一半的錢，一千個小時還是可以賺五百倍的錢，這樣賬就很好算了。

如果真的能把數字人做到端到端，只要輸入公司内部的東西，選一個形象、聲音按一個鈕就開始直播，等于賣給這個企業一個印鈔機，印鈔機要收租賃費就可行。除了直播以外，我們的 AI 2.0 數字人解決方案已經跑通了更多業務場景，比如 AI 伴侶、IP 形象、辦公會議等等。

整體來看，零一萬物 ToB 整體解決方案會采取「一橫一縱」的打法。先将單個行業做深做透，進而以自身技術能力和行業積累為基礎，凝練出标準化的 ToB 解決方案，為各行各業的企業客戶将本提效。

問：除了數字人解決方案，零一萬物是否還有其他 ToB 解決方案？

李開復：除了我們已經發布的 AI 2.0 數字人、API 之外，零一萬物目前還有 AI Infra 解決方案、私有化定制模型等其他 ToB 業務，我們會在近期正式對外發布，敬請期待。

問：零一萬物在海外推出 ToC 產品，國内陸續推出 ToB 產品，當前在 B 端、C 端的產品現狀如何？

李開復：一個大模型公司同時做 ToB 和 ToC 很辛苦，銷售方法、利潤的比例、需要多少投放才會有收入等評估體系完全不同。也需要多元化的管理方式，因為兩個團隊的基因不一樣，做事的方法、衡量 KPI 的方法都不太一樣。我在這兩個領網域有經驗，也在試着做，但也絕對不能什麼都做。

ToB 上，零一選擇做國内市場，是因為找到了一些破局的空間，比如用數字人來做零售、餐飲等，能做一個完整的解決方案。另外還有兩三個領網域開始在做，現在還不方便披露。ToB 不做海外市場，是因為全世界的範疇裡，ToB 供應商基本都是當地的。選擇在國内做 ToB，還要選擇有利潤的解決方案做，而不只是賣模型、不只是做項目制，這是我們 ToB 的做法。

ToC 我們主要布局海外。當我們開始做零一萬物時，國内還沒有合适的中文模型，只有在國外先嘗試，迭代了一個、兩個、三個產品，這些產品現在表現有些很好，有些沒有那麼好，在不斷地調整中。

我們也在觀察什麼時候适合在國内市場做什麼樣的產品，目前做 ToC 產品面臨一個很大的問題——流量成本越來越高。我們也看到有些友商的用戶從十幾塊人民币加到三十多塊人民币，近來還有相當的流失，在這樣一個環境裡，我們會非常謹慎，先不推出中國本土新的 ToC 應用，同時已有的產品還會繼續維護，但更多的精力會在海外的土壤用更低的成本買到非常高質量的用戶，或者能直接把 App 賣出去，讓用戶來訂閱收費，那邊訂閱習慣相對成熟。

換句話說，現在現狀選擇在海外做 ToC 產品，變現能力和消耗用戶增長的成本算賬可以算得過來，以後再關注國内有什麼機會可以推出。

問：今年 5 月，Yi-Large 把中美頂尖模型的時間差縮短到六個月，這次 Yi-Lightning 發布直接擊敗了 GPT-4o，把時間差甚至縮短到了五個月，你覺得之後中美大模型如何縮短時間差？

李開復：縮短時間差非常困難，我不預測我們可以縮短這個時間差。因為畢竟人家是用十萬張 GPU 訓練出來，我們用的是兩千張 GPU 訓練出來。

Yi-Lightning 的效果是因為團隊和社區大家都熱心聰明去使用，去理解對方做出來的東西，再加上我們自己每家的研發有特色，比如數據處理、訓推優化等等，現在這一套方法論在零一萬物已經成熟了，我們有信心把自己的創新加上我們的一些特長，在關注 OpenAI 和其他公司發布的新技術，盡快地去能夠了解這些技術的核心重要性，然後把它的能力在我們自己的產品裡面發揮出來。

我覺得這套方法保持在六個月左右，就已經是很好的結果了。如果期待破局，可能需要一個前所未有的算法才有機會。我們千萬不要認為落後六個月是一個很羞恥的事情，或者一定是要追趕的事情，因為我很多海外朋友都認為中國會遠遠落後，人家十萬張 GPU 等，我們要被甩掉三年、五年甚至十年都有可能，現在零一萬物證明了不會落後這麼多，而且這次 LMSYS 的榜單上也有其他兩家中國公司表現不錯。

（本文首發于钛媒體 App，作者｜林志佳，編輯｜胡潤峰）