對話王小川：理想主義和現實主義，都只是AGI的二維投影

今天小編分享的互聯網經驗：對話王小川：理想主義和現實主義，都只是AGI的二維投影，歡迎閱讀。

訪談 | 鄧詠儀楊軒

文 | 鄧詠儀

編輯 | 楊軒

湧現（Emergence），是生成式AI浪潮的一個關鍵現象：當模型規模擴大至臨界點，AI會展現出人類一般的智慧，能理解、學習甚至創造。

「湧現」也發生在現實世界——矽基文明一觸即發，AI領網域的創業者、創造者，正在用他們的智慧與頭腦，點亮實現AGI的漫漫征途。

在新舊生產力交替之際，《智能湧現》推出新欄目「湧現36人」，我們将通過與業界關鍵人物的對話，記錄這一階段的新思考。

歡迎關注

很難想象，近十年裡有哪個尖端技術的普及速度能像大模型一樣快：從ChatGPT橫空出世，到如今國内熱烈讨論落地和商業化，僅僅過去一年多的時間。

但對承載了巨大期待的一個行業而言，現在的進展很難說令市場滿意。多數AI應用或者項目都尚在襁褓之中，又或是昙花一現——目前國内流量最高的AI應用，DAU不過百萬級别；靠AI收割第一波财富的不是從業者，而是賣199元AI課的"賣課大師"李一舟。

這種失意随着近期的商業化讨論不斷發酵。不少投資人認為，埋頭做AGI（通用人工智能）希望渺茫，一旦國外有新一代模型開源，很多投入就是徒勞。

選擇擺在創業者們面前：是一路直衝，将Scaling Law（規模定律）拉到最高，無限接近AGI；還是"見好就收"，盡快讓技術落地賺錢，快速投身到中國的商業社會裡？這兩派觀點随着投資人朱嘯虎、月之暗面創始人楊植麟的近期發言，在業内引發了争議。

王小川所創立的百川智能，試圖找到一條更"立體"的路徑。

"我覺得每一種主義都是看待世界的一個視角，一個投影，但他不代表全部的真相。"王小川将其概括為八個字"盲人摸象，小馬過河"。

王小川的許多觀點，有着上一代中國互聯網競争的影子：他的上一個公司搜狗，從誕生起就面臨百度、360等對手的圍追堵截，因此要快速想明白如何落地、生存。

上一次36氪與王小川對話時，百川剛剛成立，當時他就極為強調要"雙輪驅動"，技術和應用要并行地做。

在王小川躬身入局整整一年後，我們看到他更多的新思考。他的核心觀點在于：AGI的最終目的是要"造人"，所以單純找個場景，造一個工具或產品，意義不大。

同時，考慮到國内市場的現實情況——無論是人才還是資金都有限，短期用巨量資金砸出規模巨大的模型，這并不現實。

"AGI的理念肯定要有，但在爬AGI的高山時，也要考慮找好'補給站’。"王小川表示。

醫療是現在百川押注的重要方向，百川智能希望能利用大模型真正造出AI醫療助手，從而實現生命模型的目标。這是王小川想出的當下中國AGI的可行路徑：既和AGI的目标同頻，數據和場景也都還沒有被大公司所壟斷。

王小川對技術和商業都保持樂觀，也希望市場能夠給這個賽道更多耐心。他認為，中國大模型的進展遠比大家想象的要進展迅速。"去年這個時候，大家都特别擔心中國能不能跟上GPT-3.5。但今天大家在問：什麼時候能到GPT-4？"

一切看起來都還為時尚早。2024年元旦期間，王小川收到朋友的祝福信息，他樂呵呵地回復："智能紀元貳年快樂！"

"去年是智能紀元元年，今年是第二年，"王小川說，"我認為我是看到了未來的模樣。"

以下為36氪與王小川的對話，經整理編輯：

高看或俯視技術，都會錯失很多機會

36氪：最近AI圈還挺熱鬧，金沙江的朱嘯虎最近公開表達的觀點引起了廣泛的反響，裡面也提到了你，最近看這篇專訪了嗎？第一反應是什麼？

王小川：好多朋友轉給我，轉給我還說：哈哈，這是在誇你，誇百川。我也看了，裡面提到我三四次。

其實他也沒有對我個人的，或者對百川的負面情緒，這個不代表朱嘯虎完全沒有AGI理想，只是他對今天大模型這個事情是非常悲觀和負面。文章裡的語言表達也比較率真，這還挺有喜劇感和衝突的。

36氪：他抛出很多觀點，包括大模型這件事創業公司沒有資格做，也許終局是賣給大公司，不賺錢的公司不投等等。按百分比來看，你多大程度同意他這些觀點？

王小川：我80%是同意的，場景确實很重要，有場景才有生意的本質。這是很率真、真實的表達，邏輯很自洽。第二，這也是對他自己的LP負責任的做法。在他的生意本質裡面，他現在只能投他覺得靠譜的事情，不能投太高風險的事情了。

他（朱嘯虎）說看不見，想不清楚，那讓他相信的唯一辦法，就是做出來給他看。那我也接受部分投資人有這樣的想法。

36氪：那不同意的部分是什麼？

王小川：他對大模型并沒有直接的體感。

我覺得做技術投資有兩種角度，一種是高看技術，覺得技術有一種光環，能幹這個能幹那個。

另一種視角是俯視技術，更多是看技術的價值、場景、PMF，能不能解決具體的問題。這種投法不會犯大錯，不會投出一個特别不成功的企業。但在生成式AI會帶來颠覆性機會的時代裡，我認為這可能會錯失很多機會。

36氪：今天你感受到業界最關心、最應該讨論的問題是什麼？

王小川：就是能否做出超級應用。

你如果沒有超級應用就投那麼多錢，沒有超級應用出來，怎麼辦？所以朱嘯虎就說不投，然後月之暗面就說scale，模型好了以後應用就自然有了。但我覺得他們都沒有談場景本身。

36氪：你覺得你偏向哪一派？

王小川：我覺得每一種主義都是看待世界的一個視角，一個投影，但他不代表全部的真相。

我更願意用一個人生哲學來解讀，就八個字：盲人摸象、小馬過河。他們都是只看到各自世界的投影。

36氪：怎麼解釋？

王小川：我覺得我會更完整地看到這只象。

這是個升維的概念，比如我們畫個圖，一個圓柱體，你從上往下看，它是個圓。但你平視着看，是個方形，你非要說方對還是圓對呢？它到底是哪個東西？其實它是個圓柱體。

小馬過河的意思是，每個公司、投資機構都有自己的角色和選擇，我們也不是上帝，而是要做自己。

去年我去美國的時候，我看到OpenAI的登月計劃，是要把1000萬張GPU連在一起做計算。英偉達一年生產的高端芯片也才100萬張，所以美國想的是未來能源會不會不夠用。

那麼中國有自己的定位，比如朱嘯虎就更像是看小花小草，我不求你做多大，但你能盡快找到場景，盡快賺錢。

企業供圖

36氪：朱嘯虎的觀點多大程度代表現在的投資人的意見？你覺得他們為什麼會那麼想？

王小川：我覺得挺正常的。做大模型的颠覆性變化在于，一是模型越大效果越好，它能掩蓋掉小模型，所以投資不是說一個固定投入，就可以開始有收益，而是要持續不斷地投入。

二是模型和應用的關系發生了變化。随着模型體量越大，很多應用也被碾壓了。對于投資來說，如果你沒有對某個場景很有把握，那投資就是個無底洞。

甚至美國也沒有給我們帶來什麼榜樣。以前我們的習慣性做法是，美國把技術解決完了，技術已經不是問題了，我們再去做場景，但現在不是。

這種情況下，投資人不适應是正常的，投資方法也确實會發生變化。

36氪：朱嘯虎是上一波移動互聯網時代裡，堅定投To C方向，注重規模的那波投資人。所以他今天講出這樣的觀點，會更讓人出乎意料。

王小川：他是我很尊重的投資人，但不同時代有不同的投資選擇。

上一個互聯網時代，大家都是做讓生產關系有變化的平台，滴滴、抖音，都是做連接匹配的，這是生產關系的變革。但今天的大模型，是直接提升生產力的。所以改變投資方法，我覺得也特别正常。

36氪：對創業者，上一個時代的打法也不适用了。

王小川：不行的。有的公司說我現在拿這個大模型，學習之前字節的那種APP工廠的做法，看哪個跑出來，那我覺得反而是走得更偏了。很多東西是不能復制的。

包括我們這次創業發現，在很多技術定義上，3年、8年的這種經驗沒用。現在做大模型最好的就是剛剛畢業的博士生，而且之前就是參與大模型研究的。經驗越多，可能變得包袱越大，需要更多變化調整。

模型即應用，核心是找到TPF

36氪：做大模型也做了一年了，你這一年下來整體感覺怎麼樣？

王小川：有種市場的"推背感"，技術發展太快了，每天都有新的論文，從Pretrain（預訓練）到SFT（監督微調），數據從公開網絡數據到合成數據，研發節奏非常快。

36氪：這一年的商業化情況怎麼樣？

王小川：現在商業化遠不在我們這樣的關鍵詞體系裡面。

36氪：你去年去美國考察完之後，說目标要變成"技術上慢OpenAI一步，應用上快三步"，技術要提速。和你剛剛說的相悖嗎？

王小川：落地不等于商業化。你得更有應用導向、場景，在場景端先把價值創造出來，這就叫落地。無論是百度還是抖音，第一天也不是先商業化。

我們今天最要解決的問題，就不是Money這個事，是TPF（Technology Product Fit），而不是PMF（Product Market Fit）。

36氪：這和以前說的PMF區别在哪？

王小川：講PMF，是因為我們以前默認技術不是事兒了，已經可以用了。但大模型是之前的時代沒發生過的問題。哪怕在美國，現在也還是只能讓技術解決一切問題。技術有了，場景自然也有了，這是不同的做法。

36氪：國内幾乎所有做大模型場景都在說，我們要做模型，我們要做應用，雙輪驅動。百川也說雙輪驅動，你們跟市面上的廠商有什麼不一樣？

王小川：我們認為模型即應用，同時我們定義的三個價值觀（健康、創造、快樂），對應三個世界（生命世界、真實世界、虛拟世界），你們應該沒聽到第二家這樣講的。

36氪：具體投入到什麼樣的領網域，決定了大家輪子的不一樣？

王小川：我一直避免用場景這個詞。生命模型是一個場景嗎？

場景只是對應PMF（Product Market Fit）裡的M，這是用戶需求的概念，但這不是等于我們所認為的世界模型，我們說的這個模型是一個數學概念，是我們對世界的建模。

我們現在更多要談的是TPF（Technology Product Fit），把TPF打穿了，先要回答大模型本質上是個什麼東西。

36氪：能不能舉個例子？

王小川：比如，一個模型如果是一個生命模型，那我認為健康服務和它是一體的，我就在裡面做顧問、做助手。但如果是一個虛拟世界的模型，我就做娛樂。

36氪："生命世界"、"虛拟世界""真實世界"這三個世界的思考是怎麼來的？

王小川：我是從AI怎麼投影到我們所處世界的角度出發的。

我們是活在現實世界裡的，但我們也知道，人有精神上、情感上的需求，是會有夢境的，這是虛拟世界。

最後一個是生命世界。它有别于真實世界，物理世界是熵增的，但生命是熵減的。

所以，創造、健康、快樂是這三個世界對應的價值觀。

（36氪注：熵增、熵減皆為熱力學原理，熵增現通常喻指一個封閉的孤立系統裡，事物從有序走向無序——比如衣服穿久了會變舊，最終走向不可用、消亡。但據物理學家薛定谔的觀點，生命是熵減的，生命的本質是一個負熵系統，人類可以通過攝取外部的能量來讓自己的生命延續，讓身體重新健康起來）

36氪：TPF的這個T（Technology），現在有什麼可以提供10倍好于以前的能力？

王小川：大模型核心是在造"人"，不是在造工具。人和動物的區别是：第一，人會語言，這是最本質的事情，第二，人會創造使用工具。

昨天還有朋友和我聊，說大模型特别蠢，連7位數的乘法也不會做。我就說，那人也不會呀？

大模型不是精确嚴謹的計算器，也不是只幫你尋找信息的搜索引擎。大模型是一個智力引擎，從推理到決策，幫你做決策的。

36氪：但我們也觀察到一個現象，現在AI應用整個生态裡，除了ChatGPT等極少數頭部產品之外，很多產品的月活可能就只有百萬左右，離"超級應用"很遠。

王小川：像朱嘯虎講的，現在很多應用只是"世界"裡的一個零部件。現在好多應用，我認為都還沒有能夠產生真實的用戶價值。

36氪：中間的gap主要在哪？

王小川：因為今天的模型很多都是工程師推動的，他們還是從技術去想，所以從技術到產品到marketing這些事上，之前的這樣一種思考、沉澱和探索還是不夠的。

36氪：所以需要不同的團隊嗎？比一個團隊想做超級應用，應該具備什麼樣的素質？

王小川：每個公司情況不一樣，也有人在小場景裡，用小模型，也有不少人賺錢的。

今天的問題不是在于大模型無法賺錢，而是要找到通向AGI的道路上，沿途有什麼好場景可以賺錢。我們不是沒有場景，而是要想明白：AGI和場景的關系是啥？

36氪：如果說你覺得超級應用還沒達成共識，那你自己想明白了嗎？

王小川：我覺得模型即應用，這是一體的。模型代表了是你所創造的數學模型對世界的反映。第二是，現在這個模型為什麼樣的價值去服務？我覺得我們要回答這兩個問題。

在AGI的路上，要找到同頻或更高的場景

36氪：你說大模型核心是在造"人"，那你怎麼思考AGI當前的實現路徑？你對實現AGI有多堅定？

王小川：AGI的理想是不可繞過的一個話題，必須要有。

我覺得實現AGI有兩個路徑，一是把技術做足夠好、足夠大之後，問題都解決了，不需要Prompt了。

第二是，在模型還沒到那麼大規模的時候呢？在爬這座山的時候，我們還要在中間找補給站。

我們并不是只走研究技術問題的路線，而是更希望讓技術來支持我們"造人"這個目标。

我舉個例子，寫廣告文案不需要特别大的模型，模型做大反而會拖住你的。你再投幾億美金到GPT-4、GPT-5幹嘛呢？投入產出就變成負的了。

36氪：什麼樣的場景才算和AGI的目标有關系？

王小川：第一，這個場景要足夠終極，成長性足夠大，要讓大模型走到AGI的時候，才能讓這個場景的實現達到完美的程度。

但同時這個場景的起點又要相對比較低，哪怕沒有達到AGI，這個場景也已經可以產生價值，切入廣泛人群了。

36氪：那你們要做什麼方向？

王小川：原來我們想做的方向有法律、醫療，但後面我們認為做醫療是我們最懂、最心動的，法律就先放棄。

36氪：為什麼這麼看好醫療？百川是國内大模型廠商裡對醫療場景強調最多的。

王小川：我2021年把搜狗賣給騰訊，寫告别信的時候就講了，往後20年要做大眾健康和醫學，其實我當時是希望做生命的數學模型。

我們知道，把物理學變成數學模型這個工作，是牛頓做的。今天的大語言模型（LLM）是把語言變成了數學，今天我講的把生命變成數學這個事情，是不低于大模型的，它能幫助我們更好地通向更遠的生命世界。

36氪：是什麼讓你覺得可以做得好醫療？上一個移動互聯網時代，無論是巨頭還是AI公司，無論To B還是To C，在醫療場景上都不能說做得成功。

王小川：我覺得大家對醫療的本質沒有太理解，現在的關鍵是要造有醫療知識的"人"。

上一代互聯網的本質，是在解決信息傳遞、改變生產關系的問題。醫療領網域最缺的資源是醫生，但醫生的供給是有限的，醫療系統無法有更大的供給，所以上一代互聯網做挂号什麼的，也沒有意義。

我們就談需不需要的問題，我們需要更多醫生嗎？如果需要，那剩下的就是技術問題。

36氪：上一代AI也有做很多影像識别輔助診斷，所以你覺得也沒有解決核心問題。

王小川：不work，上一個時代的AI并沒有解決機器的認知問題。一個醫生要和病人正常溝通，需要将學習到的知識和後來的經驗融會貫通，靠以前的技術，在影像裡學經驗，AI是理解不了後面的概念和邏輯的。

36氪：這些人類經驗知識的數據是公開的嗎？數據獲取的門檻會很高嗎？

王小川：醫療是各個行業裡數據量最充分的行業，沒有之一。

醫生其實就是初級的科學家，每天都要做科研寫論文的，論文還不像物理學論文，給一個最底層的推導，而是要做臨床幹預性的實驗，只要有幾十例病人在裡面，就是很好的論文。

從case study、RCT再到後面的Meta分析，以及大量的論文、醫療指南、專家共識等這些醫學領網域知識的總結都能夠成為大模型的數據，這些數據以前機器是看不懂的。

36氪：相當于大模型補足了"AI醫生"上學、在醫院積累經驗的部分。

王小川：能看論文能看指南，可以說有60分起步了。

36氪：接下來，最有可能迅速發生改變的幾個功能或者場景，是什麼？

王小川：我們可能還要一段時間才能給大家展示產品。但我提個很好的場景，問診。

大模型能夠有效地降低誤診率，這在很多小地方的基層醫院，是個大問題。如果你頸椎有問題，如果醫生經驗不夠，可能會診出不同的結果，影響治療。但有了大模型，它可以按照診斷的SOP（标準化流程）來提問，這可以充分展現它的能力。

36氪：再具體一點，你覺得你想做的這個產品，是什麼？

王小川：就是助手。

36氪：在這些行業裡，颠覆大廠的可能性有多少？

王小川：你得想，什麼場景、數據不在大廠手裡。醫療場景在大廠手裡嗎？要按這種邏輯來思考。

36氪：現在也有很多讨論說，大模型在To B落地，成本太高又太卷，但To C現在也沒看到真正爆發的應用，有一些AI生成圖片類的應用，大家會覺得昙花一現。

王小川：如果我們蓋個摩天大樓，你就不能指望它三個月蓋完。你蓋個草棚子是很快的。等我們在這個樓裡面了才會看到，這可能是個遊樂場，再上面會是個醫院。

36氪：現在國内大模型廠商在商業化上思路已經有分化，有的側重To B，還有的就只做To C應用。百川To B和To C都做，有側重嗎？

王小川：我們現在主要To C，To B占20%左右，很小的一個比例。

36氪：現在國内私有化部署的大模型，單價從原來千萬元級已經打到了百萬元甚至更低。我們可以說，國内To B市場天花板就是很低嗎？

王小川：To B确實比To C天花板低很多，現在大模型那麼卷，所以這個結論是對的。

另一個對我們的啟發是，如果你是模型廠商，沒有獨有的價值，這個遊戲就變成了拼價格的事情。

快速讓場景達到可用，才能成為壁壘

36氪：一年前百川剛成立時我們問過你，現在想再問一遍：現在中美在大模型上的差距有多大？

王小川：從0到1階段的一些創新，我認為差距是在拉大的。但已經突破了從0到1，技術接近可用的時候，我們是跟進得夠快的。

去年初，大家都特别擔心能不能跟上GPT-3.5，但今天，大家在問，什麼時候能到GPT-4？

無論是中國還是美國，大家的進步速度都不是跟中國公司相比。在美國，哪怕是Google等公司都有點跟不上OpenAI的狀态。OpenAI是現在人才、算力、資金的制高點。

36氪：這一年以來，你對AGI的實現路徑，或者認知和想法有什麼大的迭代？

王小川：理解沒有太大的變化。我們認為語言為中心，現在依然是。

我覺得更多是從願景走到實際的體感了。原來做模型的時候，你會有一種衝動和慣性，在模型之上，把我們原有的一些能力放進去，外挂一些應用。但現在很清楚，是要把這些能力要訓到模型裡面去。

36氪：可以展開講講嗎，把什麼樣的能力挂進去？

王小川：比如搜索，原來是像把搜索引擎挂到模型上，現在更多是想讓模型懂得怎麼用好搜索引擎。

36氪：用開源模型會是個問題嗎？國内無論是做AI應用還是說模型層，都有基于開源模型去做的。這會導致我們整體技術上落後嗎？

王小川：這不叫落後。美國很多公司也在用開源模型，開源、閉源，這兩件事都是生态裡很重要的事。在美國，如果不是Meta的LLAMA發布，讓開源這個生态打起來了，他們也只有閉源模型。比如我們自己的開源模型，Baichuan2-13B，也讓很多中國企業受益，用小模型+數據去做產品。

并不是開源落後的問題，而是需要去計算，到底什麼公司能夠既把模型scale（規模化）到接近OpenAI的水平，同時還能保證自己活下去，這是一個關鍵問題。

36氪：這一代生成式AI技術發展的瓶頸，或者說現在遇到的最大問題，會有哪些？

王小川：如果沿着Scaling Law繼續走，确實對能源消耗太大了，必須把成本降下來。

第二，現在有人提壓縮即智能，壓縮已有的數據，我們稱為分布内的數據，但分布外的知識、能力，要怎麼用進來？這是以OpenAI旗下Sora為代表的技術所不夠的地方。Sora雖然能力強，但計算能力要求高，而且處理的只是一種快思考，缺乏慢思考的基礎。

36氪：對于大模型，接下來你們要重點投入的資源會是什麼？

王小川：第一，要scale的話，大家都有共識，要數據、要算力。

并且，我們所說的三個世界裡：真實世界、虛拟世界，還有生命世界。每個世界裡，我們要去獲取和構造這個世界裡面需要的這些數據，更有針對性。

36氪：什麼才能造就壁壘，數據本身嗎？

王小川：是能夠更快地使場景達到可用狀态，而不是數據本身。

現在，大家每三個月到半年，你用一半的數據訓模型，只要是高質量好的數據，就能達成一樣的效果。

數據質量越高的時候，對規模的要求就變小了，那訓練成本也至少小一倍了。

36氪：錢也是重要資源。現在大廠的投資策略是廣撒網，誰都投，你怎麼看這種做法？

王小川：我覺得這就是大廠做貢獻，能推動進步的方式啊。一開始有人問我們為什麼不做人民币架構，做美元架構，也是有這個原因——我們一開始就覺得CVC（Corporate Venture Capital）是最該争取的，他們比純VC能更長久地支持這個賽道，政府的角色可能沒那麼快進來。

36氪：今年遇到的投資人裡，關心的問題會有什麼不一樣？

王小川：大廠更多關心算力夠不夠，VC關心場景咋樣。

36氪：2023年以前，大模型領網域融到大錢的公司就只有屈指可數的家，百川是其中之一。當時大家的融資規模大概都在3億美金上下。最近月之暗面的10億美金融資消息出來，是否意味着戰事規模更新了？

王小川：這是正常邏輯。大家都是認為往下是需要逐步去提升這個融資規模的，是行業共識。

36氪：對百川來說，融大錢也是很重要的下一步？

王小川：如果往AGI走，你是需要大錢的。但對我而言，我可能更看重超級應用，至少讓大家看到這個事，是有畫面感的。

36氪：就是沒有超級應用，這個大錢其實也不會來。

王小川：其實我們融的錢，按照現在的進度，也足夠支撐很長時間了，我覺得你比我焦慮多了。

36氪：這是我們感覺到的業界情緒。從去年下半年開始，投資人對大模型的态度變得更冷靜。你覺得呢？

王小川：肯定的。大家開始想超級應用在哪兒，否則一股腦地融資，如果沒超級應用，之後融錢也很難。

36氪：現在大模型在國内拿錢已經很不容易，你怎麼說服投資人再繼續給你投錢？

王小川：傳統VC确實很難繼續投錢，風險高、看不清。我覺得往後有兩撥力量，一是大廠，其實美國也是，Google、亞馬遜、微軟都這樣。二是政府，這不是靠風險投資邏輯驅動的。

36氪：今年，國内大廠會開始并購大模型公司嗎？

王小川：我覺得今年還不會。

36氪：但大廠都全都投了，還投了好多。

王小川：今天能入大廠眼的廠商，如果你做好了，你還能發展下去。但你做不好的話，人家也看不上你。

36氪：去年，全球AI圈裡，你覺得發生的最重要的事兒Top 3是什麼？

王小川：GPT-4發布是重大的裡程碑，比GPT-3.5有巨大的提升，而且後續每一代還會有。

其次是競争對手起來了，比如Anthropic、還有馬斯克的X.AI，不再是OpenAI一家獨秀。

還有一個事情是OpenAI内亂，這背後代表的是兩種技術思想的分歧，而且大家都不知道AGI什麼時候來，會造成多大影響。

36氪：這些事對國内來說是什麼信号？

王小川：首先對中國來說我們必須跟進，如果市場上只談商業化，那我們就完蛋了。

Sora不在AGI主線上，語言才是中軸

36氪：最近Sora讓全世界都又震撼了一次，你對Sora怎麼看？之前聽說團隊裡很多人和你說要去做Sora，你還發火了。

王小川：對啊，智力是藏在語言裡的。Sora既不是AGI，又不是應用。

大家肯定都有技術好奇心，有新東西總是想參與。但我坐在CEO的位置上，就是要做戰略道路選擇，決定做不做。

36氪：所以你覺得普遍已經超過GPT-3.5這個線了？

王小川：頭部這幾家大模型公司，包括大廠和創業公司，已經超過了。

36氪：你對Sora怎麼看？這對做LLM（大語言模型）的人來說，有什麼意義？

王小川：意義不大。

36氪：為什麼？

王小川：大家有一個誤解在于，覺得Sora好像比GPT又高級了，對吧？原來是文字的，啪一下，又變視頻了。

語言所表達的是概念層面的"空間"，但視頻所表達的是肉眼可見的空間。語言對空間實體的表達能力，是遠高于視頻的。本質上，語言描述的概念，代表着對世界更多的認知。

Sora的突破在于，讓視頻上的表達和語言空間去統一編碼（即讓大模型将語言和物理意義上的空間表達進行匹配），而且還沒有完全解決這個問題。

36氪：畢竟視頻所對應的多模态技術，看着比較Fancy。

王小川：你講得特别對，Fancy。Sora的衝擊力更多來自于感官上的衝擊，但這并不代表技術是更強的。

GPT的技術難度，以及它可以實現的規模是遠高于Sora的。現在大模型到了萬億參數級别，Sora是百億級别，還是差很多的。

并且，OpenAI是要做AGI的，以後會陸續發GPT-4.5、GPT-5，但Sora只是OpenAI的side project（子項目），并不是主線。

36氪：人類所接收到外部信息裡面，語言當然是很大一部分，但影像這類視覺信息，不也是很重要的一部分嗎？

王小川：狗是會看視頻的，但狗會說話嗎？人類的智力是在語言裡面的。在實現AGI（通用人工智能）這件事上，視覺不是關鍵。

36氪：Sora的訓練其實也基于很多LLM（大語言模型）的技術，百川自己也有對多模态投入，會往Sora這個方向做嗎？

王小川：我們不會做。Sora既不是AGI這個方向的事，也不是一個具體可見的應用方向。現在Sora生成一分鍾視頻需要20分鍾，60美金，做電影可能有點用，但做C端一些互動性的東西，是不太實用的。

36氪：如果Sora不是你們的主線業務，那是誰的主線業務？字節嗎？

王小川：特别适合。這個事既沒有語言需要那麼多智力，又适合直接來跟進。

36氪：而且還特别耗錢。

王小川：哈哈哈哈。

大模型的未來不是工具，而是夥伴

36氪：我看到你在今年春節發了一個新年願景，是說造一個大模型時代的新物種，不會要求它像工具一樣，而是達到人類對夥伴的要求。這個新物種的載體會是什麼？

王小川：我覺得載體不是本質問題，但它以後一定會依附某種硬體，比如手機、眼鏡、耳機，都可以做。

36氪：如果復盤過去一年，你覺得做的最重要的事是什麼？

王小川：做得足夠早，和時代脈搏同步了。我們先是把團隊搭建起來了，并且現在模型能力接近GPT-4，在中文領網域很多任務是超過的。

我們對開源社區也有貢獻。去年9月份，我們發布了百川的開源模型，很多大廠還有創業公司都在用。我們得到的數據是，現在報備底層模型的200多家新公司裡，有一半以上都是用我們的模型。

并且技術主張和願景都沒有走偏，包括去年我提的"雙輪驅動"，大模型和超級應用要一起做，以及增強搜索、強化學習等等方向，今年也會開始一一兌現。

36氪：你怎麼想象未來AI能做到的事情？

王小川：今年元旦，有朋友發消息給我說，小川元旦快樂。我就回復：智能紀元貳年快樂。

在我眼裡，去年是智能元年，今年是第貳年。我認為我是看到了未來的模樣。

去年4月我下場的時候，當時我就在講，AI一方面是提升這種生產力，另一方面能成為我們的夥伴，甚至還能創造出虛拟世界，成為大家娛樂的天地。

36氪：那些沒有被AI學到的數據，那就是AI的盲點，我想這對人類的創造力提出了全新的需求，我們也許不能創造出一個和AI差不多水平，或者人類已有知識庫裡存在的東西。

在現在AI的水平下，我們人類有價值的地方，或者應該發展價值的地方是什麼？

王小川：不同人選擇不一樣，比如創造力這個現在還是暫時取代不了。所以我覺得就做好兩個事情，一個是用好AI，你不會用，你就可能被淘汰。二是投身做AI，把智慧放進去，比如來百川做AI，哈哈。

去年我說了句有點争議的話，我說程式員也是自己的掘墓人，把自己融入進去了，從"小我"變成"大我"。

36氪：但融入之後，我們就會失業了？

王小川：人早晚都會死掉的，怕啥呢？

36氪：大家肯定想的是，死掉之前不要失業……

王小川：但你失業不失業，都要死掉，只有生死才是大問題嘛。

36氪：比如像真正做大模型的人，對未來可能創造出來的東西，你會有恐懼嗎？

王小川：沒有恐懼。我官宣下場的時候寫了句話：發展AGI，幫助繁榮和延續人類文明。這兩個任意選一個，都挺好的呀。

36氪：所以這兩個是可以分開看的。

王小川：對的。

36氪：想過有失敗的可能性嗎？

王小川：現在想的是解決各種困難。腦子确實裡沒有失敗這個念頭，最好也不要想這個事。

36氪：對于現在的AI行業，您最想知道的一個問題，或者看到的事情，是什麼？

王小川：我想看到GPT-4.5或者GPT-5到底有什麼大的變化，有多大的進步。

36氪：2024年，你對AI行業會有什麼預測嗎？

王小川：第一，我覺得美國還會不斷地冒出讓我們吃驚的進展。

第二，我覺得我們國内市場既不要狂妄，也不要妄自菲薄。我們已經能長出自己的能力來，GPT-3.5，GPT-4，我們是能跟上的。今年，各個廠商都會開始做差異化，我對這個比較樂觀。

歡迎交流