今天小編分享的互聯網經驗:對話李開復:中美大模型差距越來越小,我10年不“套現”,歡迎閱讀。
零一萬物 CEO 李開復博士
钛媒體 App 獲悉,5 月 13 日上午,創新工場董事長兼 CEO、零一萬物 CEO 李開復博士在北京發布全新零一萬物千億參數 Yi-Large 閉源模型,以及包括開源模型等產品矩陣,并披露今年公司 To C 單一產品收入達 1 億元人民币。
李開復表示,随着一年前 ChatGPT 風靡全球,以 Yi-Large 為核心的中國大模型從此前 " 追趕 " 到如今性能超越 GPT-4 大模型,中美大模型差距越來越小。
" 一年前,中國大模型感覺太落後(于美國)了。但今天我們非常自豪的說,我們(零一萬物)狂奔了一年,在模型方面至少趕上了美國最頂尖、一年前發布的(大模型)產品,當然以後還要繼續努力。但我們對未來會需要有一個沉澱和展望,不能只是拼命狂奔。" 李開復表示。
當被問及楊植麟套現話題,李開復回應稱,盡管不點評公司情況,但他創立零一萬物的時候向投資人承諾,10 年不 " 套現 ",而且他認為最好的套現方式是 " 趕快上市 ",這是其未來兩年努力的目标。
針對中國如何追趕美國大廠不斷迭代新模型,李開復回應钛媒體 App 稱,零一萬物的新模型已訓練一半,之後會朝着美國大模型繼續進步。" 我們不能保證一定趕上它(美國模型)、超過它,或者 gap 有多少,但是我們用适合我們的方法快速推進,既然我們不能用 10 萬張 GPU 來訓練,我們就會尋找别的方式,依然能做出非常好的效果。"
據悉,零一萬物(01.AI)成立于 2023 年 5 月 16 日,致力于打造全新的 AI 2.0 平台與 AI-first 生產力應用的全球化公司,由創新工場董事長兼 CEO 李開復創立,并擔任零一萬物 CEO。
2023 年 11 月,零一萬物發布首款研發的開源 AI 大模型系列 "Yi",包括 60 億、340 億參數的 Yi-6B、34B 兩個版本,性能超越;今年 3 月,零一萬物公布基于全導航圖的新型向量數據庫,名為笛卡爾(Descartes)。
今年 5 月,零一萬物推出首款免費一站式 AI 工作平台 " 萬知 ",不僅可以速讀 60 萬字《馬斯克傳》,做會議紀要、周報、寫作助手,而且還可以解讀财報、論文等各類檔案,以及幫你手機一鍵生成 PPT。同時,零一萬物宣布李開復出任萬知首席體驗官。
融資層面,截至目前,零一萬物已完成由阿裡雲領投的融資,估值已超過 10 億美元,跻身獨角獸行列。
距離 " 萬知 " 發布僅隔了不到一周,今天,零一萬物 CEO 李開復再度進行演講,并且 " 破天荒 " 地在抖音開設新賬号進行直播。
李開復(圖片來源:钛媒體 App 編輯拍攝)
李開復演講主要分為三部分:零一萬物產品矩陣介紹;沉澱和 TC-PMF(Technolog-Cost-Product-Market-Fit,技術成本 X 產品市場契合度)理論;以及最後對話問答。
首先,李開復公布零一萬物整個產品矩陣,包括開源 Yi-34B、Yi-9B、Yi-VL、Yi-6B、Yi-Spark API、Yi-Medium API、Yi-Vision API 六個模型組成的開源系統,閉源包括 Yi-Large API、Yi-XLarge APl、2C 生產力應用 " 萬知 " 以及更多 Al-First 應用。
零一萬物稱,在國際領先的底座模型之上,零一萬物實現了從應用到生态。李開復認為,這不是一個模式,不是一個產品,而是眾多的矩陣。零一萬物要讓全世界的人都能用上這個模式,肯定要顧及到開源、閉源,To B、To C 等各個領網域。
性能基準層面,李開復以千億參數規模的 Yi-Large 為例。在第三方權威評測中,零一萬物 Yi 模型在全球頭部大模型的中英文雙語 PK 上表現出色。在最新斯坦福評測機構 AlpacaEval 2.0 經官方認證的模型排行榜上,Yi-Large 模型的英語能力主要指标 LC Win Rate(控制回復的長度) 排到了世界第二,僅次于 GPT-4 Turbo,Win Rate 更排到了世界第一。此外,零一萬物将開源 Yi-34B、Yi-9B/6B 更新為 Yi-1.5 系列,每個版本達到同尺寸中 SOTA 性能最佳。
商業化層面,零一萬物今天面向國内市場一次性發布了包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多款模型 API 接口,保證客戶能夠在不同場景下都能找到最佳性能、最具性價比的方案,Yi API Platform 英文站同步對全球開發者開放試用申請。
其中,Yi-Medium API 優勢在于指令遵循能力,适用于常規場景下的聊天、對話、翻譯等場景;如果需要超長内容文檔相關應用,也可以選用 Yi-Medium-200K API,一次性解讀 20 萬字不在話下;Yi-Vision API 具備高性能圖片理解、分析能力,可服務基于圖片的聊天、分析等場景;Yi-Spark API 則聚焦輕量化極速響應,适用于輕量化數學分析、代碼生成、文本聊天等場景。
李開復強調,零一萬物的千億參數模型在評測階段已超越 GPT-4。而且零一萬物已經與 GPT-4" 并列全球第一 "。
" 我們也深深了解國外的大廠都在做產品更新,包括 OpenAI 可能不久之後也會有發布,所以我們也不會認為今天并列世界第一是最低的宗旨,它只是一個開始,之後随着國外模型進步,我們也會進步,希望能夠在彼此互相敦促之下,讓全世界的用戶都能享用到最好的模型。" 李開復稱。
另外,對于 C 端應用,零一萬物透露,接入自研向量數據庫後,其 C 端應用在保證響應速率與準确性的前提下,成本大幅降至了原用第三方向量數據庫時的 18%。在端到端 FP8 訓練的前提下,零一萬物能夠采用技術和工程手段得到與更高精度類型相媲美的訓練結果,與此同時模型訓練所需的顯存占用、通訊帶寬都極大降低。在背後,零一萬物還與英偉達進行合作。
零一萬物稱,Yi-Large 訓練環節的平均 MFU(模型算力利用率)為 58%,峰值可達 63%,已顯著超越業内平均水平。多方面優化後,其千億參數模型的訓練成本同比降幅達一倍之多。
其次是大模型沉澱和 " 模基共建 " 等理論,以及零一萬物的發展目标。
李開復表示,在大模型時代狂飙一年後,他認為 PMF 這一概念已經不能完整定義以大模型為基礎的 AI-First 創業,應當引入 Technology(技術)與 Cost(成本)組成四維概念—— TC-PMF。
" 做 Technology-Cost Product-Market-Fit(TC-PMF),技術成本 X 產品市場契合度,尤其推理成本下降是個‘移動目标’,這比傳統 PMF 難上一百倍。" 李開復表示。
李開復提到,可以預見 AI 技術未來有幾個趨勢:持續 Scaling Law(尺度規律),大模型能力快速增長,超過任何技術;同時,大模型訓練和推理成本持續大幅下降(GPT 價格年内多次下調);另外,需要頂級模型推理能力,才能實踐最佳 AI-First 應用,但有些應用會先爆發,同時要考慮推理成本和商業模式的平衡,尋找 TC-PMF 難度遠遠大于 PMF,是大模型行業集體的挑戰和機遇。
" 我覺得一定是最終產品的勝出,要靠非技術一些優勢達到口碑的傳播,比如,抖音為什麼能在這麼強大的微信之下依然能夠出來,那就是因為它在短暫的時間做了一個很棒的用戶體驗,做了一個非常好的短視頻體驗,而且專注它的用戶體驗,做出了這樣一個大型的短視頻市場機遇,但是今天我們一方面不能忘記 PMF 的重要性,而不是胡亂去燒錢。" 李開復呼籲關注 TC-PMF,拒絕 Ofo 式燒錢打法—— ofo 曾是中國最火爆的共享單車企業,但最終卻因為燒錢太多、無法還債導致停擺,目前全國已看不到 ofo 單車了。
李開復談到零一萬物的未來發展方向有四點:全球化布局、模基共建、模應一體、Al-First。
其中,零一萬物重點發力海外,聚焦生產力、社交賽道于海外應用展開探索,已有 4 款產品陸續上線。目前零一萬物海外生產力應用總用戶接近千萬,營收今年預期過億人民币,已實踐出大模型 2C 產品的 TC-PMF ——產品 ROI 為 1,初步擺脫燒錢獲客,海外已產生規模化收入;模基共建重點是發力自研 AI Infra,而模應一體就是模型、產品的體系化聯動。
随着 API、萬知等應用共同構建起了零一萬物的商業落地版圖。李開復規劃,零一萬物将作為具有前瞻性的務實者一步步實現落地,并最終達到 TC-PMF,打造出 AI 2.0 時代的超級應用,實現讓通用人工智能普惠各地,人人受益。
最後一部分是對話。接近一小時中,李開復主要回應 AI 大模型行業的發展趨勢、泡沫化以及他個人在短視頻上的一些布局等。
談及推理芯片,李開復表示," 我認為國產訓練芯片和推理芯片都要全力支持,但是兩個的差别是比較大的,因為訓練芯片還是有一定難度,主要還是 CUDA;而推理芯片它的幾個好處,一個是它本身比較簡單,第二它沒有 CUDA 這麼強的依賴性,制造過程也不難,所以我們對國產推理芯片是看好的,我們也會在合适的時候去采用,我們在創新工場也一直在關注這方面的投資機會。"
對于獨角獸的發展機會,李開復認為,OpenAI 從獨角獸做到超級獨角獸,而零一萬物有自己的特點,是可以走出一條适合自己的路。相對于追逐 GPU,零一萬物的模式可能會更務實一點。
" 我們是務實的 AGI 信仰者,所以我們一定要用最少的芯片最低的成本訓練出我們能訓練最好的模型,同時我們會不斷的去摸索找這個 TCM。國内初創公司相對矽谷公司的一個差異,我們能夠仰望星空,但也能腳踏實地;第二怎麼把推理成本做到最低,讓我們能點燃。第三是找到 PMF 需求,因為如果大家談大模型的時候,往往會覺得說美國這方面論文寫的最多、人才密度最高,這都是毋庸置疑的,但是同時你要考慮到,做一個偉大的大模型公司,它不只是底層,底層當然不能差。我們當然相信 AGI 會發生,我們也希望我們能推進 AGI 的發生,但 AGI 是夢想,但是你用夢想去指點一個公司的執行,而你又沒有這種财力去做一個超級大力出奇迹,其實就是徒勞無功的事情。" 李開復稱。
李開復認為,如果一年降低 10 倍的推理成本,2 年 100 倍,所以有 100 倍的推理成本下降,假如只要今天 GPT 1/100 的價錢來做推理成本,很多應用肯定是可以爆發的。
談到國内大模型 C 端商業化,李開復回應钛媒體 App 稱,當前零一萬物主要以國外為主,海外用戶已經有付費意願。但對于國内來說,今天萬知還沒有收費計劃,因為要考慮給用戶帶來的價值。" 至于整個行業用戶是否願意對某些功能或產品付費,我們還在觀察中,國外的是已經進入了一個 roi 為正的狀态,也就是國外我們去買的流量是低于我們能夠收到的訂閱費用,所以沒有比這個更好的。"
" 已經有用戶自己掏腰包買單,所以我們對此有相當大的信心可以做到(C 端商業化)。" 李開復稱。
談到個人抖音賬号規劃,李開復表示,此前一直沒做視頻号,如今做,主要是認為很有必要,一部分是因為有技術產品希望和大家分享,以及科普 AI 領網域的重要性," 我也希望能夠用我的抖音号來做一個非常實誠的分享,然後讓大家了解怎麼去把這個工具用好,别只看到會不會取代我們的工作 "。
李開復暗示,零一萬物接下來可能會做類似 AI 搜索的產品服務,更多聚焦于生產力效率的提升。
至于其他方向,他認為,未來 AI 大模型需要看用戶的粘性很強,傳播力很強的賽道,然後去找商盈利性,與移動互聯網商業化有些類似。" 所以移動互聯網最終出了視頻月費模式,我們也要在 AI 領網域找到。移動互聯網誕生出抖音、微信、滴滴、美團,因此在 AI 領網域,我們要不斷去探索哪些領網域技術足夠好,推理足夠便宜,用戶需求足夠強。而付費層面,再用别的商業模式的挖掘。" 李開復表示。
最後,關于月之暗面 CEO 楊植麟套現數千萬美元話題,李開復表示," 我之所以做這件事情(零一萬物),這是我 40 多年的夢想,從我申請博士論文的前一年,這才是催化推動我的努力的主要動力。至于變現,我還确實跟投資人一年前做了一個承諾,基本是一個自願主動的承諾,就是我 10 年不套現。對于我的原創和團隊,當然他們比我年輕,也會經過各種手段,但是我會讓他們能夠合理得到套現,但更重要的是,最好的套現方式是趕快上市,這個是我們未來兩年會努力的目标。"
钛媒體 App 了解到,零一萬物仍在規劃下一輪融資,同時啟動新的性能最強大模型 Yi-XLarge MoE 研發,從而推高下一代模型的性能和創新。
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)