今天小編分享的互聯網經驗:對話王小川:理想主義和現實主義,都只是AGI的二維投影,歡迎閱讀。
訪談 | 鄧詠儀 楊軒
文 | 鄧詠儀
編輯 | 楊軒
湧現(Emergence),是生成式AI浪潮的一個關鍵現象:當模型規模擴大至臨界點,AI會展現出人類一般的智慧,能理解、學習甚至創造。
「湧現」也發生在現實世界——矽基文明一觸即發,AI領網域的創業者、創造者,正在用他們的智慧與頭腦,點亮實現AGI的漫漫征途。
在新舊生產力交替之際,《智能湧現》推出新欄目「湧現36人」,我們将通過與業界關鍵人物的對話,記錄這一階段的新思考。
歡迎關注
很難想象,近十年裡有哪個尖端技術的普及速度能像大模型一樣快:從ChatGPT橫空出世,到如今國内熱烈讨論落地和商業化,僅僅過去一年多的時間。
但對承載了巨大期待的一個行業而言,現在的進展很難說令市場滿意。多數AI應用或者項目都尚在襁褓之中,又或是昙花一現——目前國内流量最高的AI應用,DAU不過百萬級别;靠AI收割第一波财富的不是從業者,而是賣199元AI課的"賣課大師"李一舟。
這種失意随着近期的商業化讨論不斷發酵。不少投資人認為,埋頭做AGI(通用人工智能)希望渺茫,一旦國外有新一代模型開源,很多投入就是徒勞。
選擇擺在創業者們面前:是一路直衝,将Scaling Law(規模定律)拉到最高,無限接近AGI;還是"見好就收",盡快讓技術落地賺錢,快速投身到中國的商業社會裡?這兩派觀點随着投資人朱嘯虎、月之暗面創始人楊植麟的近期發言,在業内引發了争議。
王小川所創立的百川智能,試圖找到一條更"立體"的路徑。
"我覺得每一種主義都是看待世界的一個視角,一個投影,但他不代表全部的真相。"王小川将其概括為八個字"盲人摸象,小馬過河"。
王小川的許多觀點,有着上一代中國互聯網競争的影子:他的上一個公司搜狗,從誕生起就面臨百度、360等對手的圍追堵截,因此要快速想明白如何落地、生存。
上一次36氪與王小川對話時,百川剛剛成立,當時他就極為強調要"雙輪驅動",技術和應用要并行地做。
在王小川躬身入局整整一年後,我們看到他更多的新思考。他的核心觀點在于:AGI的最終目的是要"造人",所以單純找個場景,造一個工具或產品,意義不大。
同時,考慮到國内市場的現實情況——無論是人才還是資金都有限,短期用巨量資金砸出規模巨大的模型,這并不現實。
"AGI的理念肯定要有,但在爬AGI的高山時,也要考慮找好'補給站’。"王小川表示。
醫療是現在百川押注的重要方向,百川智能希望能利用大模型真正造出AI醫療助手,從而實現生命模型的目标。這是王小川想出的當下中國AGI的可行路徑:既和AGI的目标同頻,數據和場景也都還沒有被大公司所壟斷。
王小川對技術和商業都保持樂觀,也希望市場能夠給這個賽道更多耐心。他認為,中國大模型的進展遠比大家想象的要進展迅速。"去年這個時候,大家都特别擔心中國能不能跟上GPT-3.5。但今天大家在問:什麼時候能到GPT-4?"
一切看起來都還為時尚早。2024年元旦期間,王小川收到朋友的祝福信息,他樂呵呵地回復:"智能紀元貳年快樂!"
"去年是智能紀元元年,今年是第二年,"王小川說,"我認為我是看到了未來的模樣。"
以下為36氪與王小川的對話,經整理編輯:
高看或俯視技術,都會錯失很多機會
36氪:最近AI圈還挺熱鬧,金沙江的朱嘯虎最近公開表達的觀點引起了廣泛的反響,裡面也提到了你,最近看這篇專訪了嗎?第一反應是什麼?
王小川:好多朋友轉給我,轉給我還說:哈哈,這是在誇你,誇百川。我也看了,裡面提到我三四次。
其實他也沒有對我個人的,或者對百川的負面情緒,這個不代表朱嘯虎完全沒有AGI理想,只是他對今天大模型這個事情是非常悲觀和負面。文章裡的語言表達也比較率真,這還挺有喜劇感和衝突的。
36氪:他抛出很多觀點,包括大模型這件事創業公司沒有資格做,也許終局是賣給大公司,不賺錢的公司不投等等。按百分比來看,你多大程度同意他這些觀點?
王小川:我80%是同意的,場景确實很重要,有場景才有生意的本質。這是很率真、真實的表達,邏輯很自洽。第二,這也是對他自己的LP負責任的做法。在他的生意本質裡面,他現在只能投他覺得靠譜的事情,不能投太高風險的事情了。
他(朱嘯虎)說看不見,想不清楚,那讓他相信的唯一辦法,就是做出來給他看。那我也接受部分投資人有這樣的想法。
36氪:那不同意的部分是什麼?
王小川:他對大模型并沒有直接的體感。
我覺得做技術投資有兩種角度,一種是高看技術,覺得技術有一種光環,能幹這個能幹那個。
另一種視角是俯視技術,更多是看技術的價值、場景、PMF,能不能解決具體的問題。這種投法不會犯大錯,不會投出一個特别不成功的企業。但在生成式AI會帶來颠覆性機會的時代裡,我認為這可能會錯失很多機會。
36氪:今天你感受到業界最關心、最應該讨論的問題是什麼?
王小川:就是能否做出超級應用。
你如果沒有超級應用就投那麼多錢,沒有超級應用出來,怎麼辦?所以朱嘯虎就說不投,然後月之暗面就說scale,模型好了以後應用就自然有了。但我覺得他們都沒有談場景本身。
36氪:你覺得你偏向哪一派?
王小川:我覺得每一種主義都是看待世界的一個視角,一個投影,但他不代表全部的真相。
我更願意用一個人生哲學來解讀,就八個字:盲人摸象、小馬過河。他們都是只看到各自世界的投影。
36氪:怎麼解釋?
王小川:我覺得我會更完整地看到這只象。
這是個升維的概念,比如我們畫個圖,一個圓柱體,你從上往下看,它是個圓。但你平視着看,是個方形,你非要說方對還是圓對呢?它到底是哪個東西?其實它是個圓柱體。
小馬過河的意思是,每個公司、投資機構都有自己的角色和選擇,我們也不是上帝,而是要做自己。
去年我去美國的時候,我看到OpenAI的登月計劃,是要把1000萬張GPU連在一起做計算。英偉達一年生產的高端芯片也才100萬張,所以美國想的是未來能源會不會不夠用。
那麼中國有自己的定位,比如朱嘯虎就更像是看小花小草,我不求你做多大,但你能盡快找到場景,盡快賺錢。
企業供圖
36氪:朱嘯虎的觀點多大程度代表現在的投資人的意見?你覺得他們為什麼會那麼想?
王小川:我覺得挺正常的。做大模型的颠覆性變化在于,一是模型越大效果越好,它能掩蓋掉小模型,所以投資不是說一個固定投入,就可以開始有收益,而是要持續不斷地投入。
二是模型和應用的關系發生了變化。随着模型體量越大,很多應用也被碾壓了。對于投資來說,如果你沒有對某個場景很有把握,那投資就是個無底洞。
甚至美國也沒有給我們帶來什麼榜樣。以前我們的習慣性做法是,美國把技術解決完了,技術已經不是問題了,我們再去做場景,但現在不是。
這種情況下,投資人不适應是正常的,投資方法也确實會發生變化。
36氪:朱嘯虎是上一波移動互聯網時代裡,堅定投To C方向,注重規模的那波投資人。所以他今天講出這樣的觀點,會更讓人出乎意料。
王小川:他是我很尊重的投資人,但不同時代有不同的投資選擇。
上一個互聯網時代,大家都是做讓生產關系有變化的平台,滴滴、抖音,都是做連接匹配的,這是生產關系的變革。但今天的大模型,是直接提升生產力的。所以改變投資方法,我覺得也特别正常。
36氪:對創業者,上一個時代的打法也不适用了。
王小川:不行的。有的公司說我現在拿這個大模型,學習之前字節的那種APP工廠的做法,看哪個跑出來,那我覺得反而是走得更偏了。很多東西是不能復制的。
包括我們這次創業發現,在很多技術定義上,3年、8年的這種經驗沒用。現在做大模型最好的就是剛剛畢業的博士生,而且之前就是參與大模型研究的。經驗越多,可能變得包袱越大,需要更多變化調整。
模型即應用,核心是找到TPF
36氪:做大模型也做了一年了,你這一年下來整體感覺怎麼樣?
王小川:有種市場的"推背感",技術發展太快了,每天都有新的論文,從Pretrain(預訓練)到SFT(監督微調),數據從公開網絡數據到合成數據,研發節奏非常快。
36氪:這一年的商業化情況怎麼樣?
王小川:現在商業化遠不在我們這樣的關鍵詞體系裡面。
36氪:你去年去美國考察完之後,說目标要變成"技術上慢OpenAI一步,應用上快三步",技術要提速。和你剛剛說的相悖嗎?
王小川:落地不等于商業化。你得更有應用導向、場景,在場景端先把價值創造出來,這就叫落地。無論是百度還是抖音,第一天也不是先商業化。
我們今天最要解決的問題,就不是Money這個事,是TPF(Technology Product Fit),而不是PMF(Product Market Fit)。
36氪:這和以前說的PMF區别在哪?
王小川:講PMF,是因為我們以前默認技術不是事兒了,已經可以用了。但大模型是之前的時代沒發生過的問題。哪怕在美國,現在也還是只能讓技術解決一切問題。技術有了,場景自然也有了,這是不同的做法。
36氪:國内幾乎所有做大模型場景都在說,我們要做模型,我們要做應用,雙輪驅動。百川也說雙輪驅動,你們跟市面上的廠商有什麼不一樣?
王小川:我們認為模型即應用,同時我們定義的三個價值觀(健康、創造、快樂),對應三個世界(生命世界、真實世界、虛拟世界),你們應該沒聽到第二家這樣講的。
36氪:具體投入到什麼樣的領網域,決定了大家輪子的不一樣?
王小川:我一直避免用場景這個詞。生命模型是一個場景嗎?
場景只是對應PMF(Product Market Fit)裡的M,這是用戶需求的概念,但這不是等于我們所認為的世界模型,我們說的這個模型是一個數學概念,是我們對世界的建模。
我們現在更多要談的是TPF(Technology Product Fit),把TPF打穿了,先要回答大模型本質上是個什麼東西。
36氪:能不能舉個例子?
王小川:比如,一個模型如果是一個生命模型,那我認為健康服務和它是一體的,我就在裡面做顧問、做助手。但如果是一個虛拟世界的模型,我就做娛樂。
36氪:"生命世界"、"虛拟世界""真實世界"這三個世界的思考是怎麼來的?
王小川:我是從AI怎麼投影到我們所處世界的角度出發的。
我們是活在現實世界裡的,但我們也知道,人有精神上、情感上的需求,是會有夢境的,這是虛拟世界。
最後一個是生命世界。它有别于真實世界,物理世界是熵增的,但生命是熵減的。
所以,創造、健康、快樂是這三個世界對應的價值觀。
(36氪注:熵增、熵減皆為熱力學原理,熵增現通常喻指一個封閉的孤立系統裡,事物從有序走向無序——比如衣服穿久了會變舊,最終走向不可用、消亡。但據物理學家薛定谔的觀點,生命是熵減的,生命的本質是一個負熵系統,人類可以通過攝取外部的能量來讓自己的生命延續,讓身體重新健康起來)
36氪:TPF的這個T(Technology),現在有什麼可以提供10倍好于以前的能力?
王小川:大模型核心是在造"人",不是在造工具。人和動物的區别是:第一,人會語言,這是最本質的事情,第二,人會創造使用工具。
昨天還有朋友和我聊,說大模型特别蠢,連7位數的乘法也不會做。我就說,那人也不會呀?
大模型不是精确嚴謹的計算器,也不是只幫你尋找信息的搜索引擎。大模型是一個智力引擎,從推理到決策,幫你做決策的。
36氪:但我們也觀察到一個現象,現在AI應用整個生态裡,除了ChatGPT等極少數頭部產品之外,很多產品的月活可能就只有百萬左右,離"超級應用"很遠。
王小川:像朱嘯虎講的,現在很多應用只是"世界"裡的一個零部件。現在好多應用,我認為都還沒有能夠產生真實的用戶價值。
36氪:中間的gap主要在哪?
王小川:因為今天的模型很多都是工程師推動的,他們還是從技術去想,所以從技術到產品到marketing這些事上,之前的這樣一種思考、沉澱和探索還是不夠的。
36氪:所以需要不同的團隊嗎?比一個團隊想做超級應用,應該具備什麼樣的素質?
王小川:每個公司情況不一樣,也有人在小場景裡,用小模型,也有不少人賺錢的。
今天的問題不是在于大模型無法賺錢,而是要找到通向AGI的道路上,沿途有什麼好場景可以賺錢。我們不是沒有場景,而是要想明白:AGI和場景的關系是啥?
36氪:如果說你覺得超級應用還沒達成共識,那你自己想明白了嗎?
王小川:我覺得模型即應用,這是一體的。模型代表了是你所創造的數學模型對世界的反映。第二是,現在這個模型為什麼樣的價值去服務?我覺得我們要回答這兩個問題。
在AGI的路上,要找到同頻或更高的場景
36氪:你說大模型核心是在造"人",那你怎麼思考AGI當前的實現路徑?你對實現AGI有多堅定?
王小川:AGI的理想是不可繞過的一個話題,必須要有。
我覺得實現AGI有兩個路徑,一是把技術做足夠好、足夠大之後,問題都解決了,不需要Prompt了。
第二是,在模型還沒到那麼大規模的時候呢?在爬這座山的時候,我們還要在中間找補給站。
我們并不是只走研究技術問題的路線,而是更希望讓技術來支持我們"造人"這個目标。
我舉個例子,寫廣告文案不需要特别大的模型,模型做大反而會拖住你的。你再投幾億美金到GPT-4、GPT-5幹嘛呢?投入產出就變成負的了。
36氪:什麼樣的場景才算和AGI的目标有關系?
王小川:第一,這個場景要足夠終極,成長性足夠大,要讓大模型走到AGI的時候,才能讓這個場景的實現達到完美的程度。
但同時這個場景的起點又要相對比較低,哪怕沒有達到AGI,這個場景也已經可以產生價值,切入廣泛人群了。
36氪:那你們要做什麼方向?
王小川:原來我們想做的方向有法律、醫療,但後面我們認為做醫療是我們最懂、最心動的,法律就先放棄。
36氪:為什麼這麼看好醫療?百川是國内大模型廠商裡對醫療場景強調最多的。
王小川:我2021年把搜狗賣給騰訊,寫告别信的時候就講了,往後20年要做大眾健康和醫學,其實我當時是希望做生命的數學模型。
我們知道,把物理學變成數學模型這個工作,是牛頓做的。今天的大語言模型(LLM)是把語言變成了數學,今天我講的把生命變成數學這個事情,是不低于大模型的,它能幫助我們更好地通向更遠的生命世界。
36氪:是什麼讓你覺得可以做得好醫療?上一個移動互聯網時代,無論是巨頭還是AI公司,無論To B還是To C,在醫療場景上都不能說做得成功。
王小川:我覺得大家對醫療的本質沒有太理解,現在的關鍵是要造有醫療知識的"人"。
上一代互聯網的本質,是在解決信息傳遞、改變生產關系的問題。醫療領網域最缺的資源是醫生,但醫生的供給是有限的,醫療系統無法有更大的供給,所以上一代互聯網做挂号什麼的,也沒有意義。
我們就談需不需要的問題,我們需要更多醫生嗎?如果需要,那剩下的就是技術問題。
36氪:上一代AI也有做很多影像識别輔助診斷,所以你覺得也沒有解決核心問題。
王小川:不work,上一個時代的AI并沒有解決機器的認知問題。一個醫生要和病人正常溝通,需要将學習到的知識和後來的經驗融會貫通,靠以前的技術,在影像裡學經驗,AI是理解不了後面的概念和邏輯的。
36氪:這些人類經驗知識的數據是公開的嗎?數據獲取的門檻會很高嗎?
王小川:醫療是各個行業裡數據量最充分的行業,沒有之一。
醫生其實就是初級的科學家,每天都要做科研寫論文的,論文還不像物理學論文,給一個最底層的推導,而是要做臨床幹預性的實驗,只要有幾十例病人在裡面,就是很好的論文。
從case study、RCT再到後面的Meta分析,以及大量的論文、醫療指南、專家共識等這些醫學領網域知識的總結都能夠成為大模型的數據,這些數據以前機器是看不懂的。
36氪:相當于大模型補足了"AI醫生"上學、在醫院積累經驗的部分。
王小川:能看論文能看指南,可以說有60分起步了。
36氪:接下來,最有可能迅速發生改變的幾個功能或者場景,是什麼?
王小川:我們可能還要一段時間才能給大家展示產品。但我提個很好的場景,問診。
大模型能夠有效地降低誤診率,這在很多小地方的基層醫院,是個大問題。如果你頸椎有問題,如果醫生經驗不夠,可能會診出不同的結果,影響治療。但有了大模型,它可以按照診斷的SOP(标準化流程)來提問,這可以充分展現它的能力。
36氪:再具體一點,你覺得你想做的這個產品,是什麼?
王小川:就是助手。
36氪:在這些行業裡,颠覆大廠的可能性有多少?
王小川:你得想,什麼場景、數據不在大廠手裡。醫療場景在大廠手裡嗎?要按這種邏輯來思考。
36氪:現在也有很多讨論說,大模型在To B落地,成本太高又太卷,但To C現在也沒看到真正爆發的應用,有一些AI生成圖片類的應用,大家會覺得昙花一現。
王小川:如果我們蓋個摩天大樓,你就不能指望它三個月蓋完。你蓋個草棚子是很快的。等我們在這個樓裡面了才會看到,這可能是個遊樂場,再上面會是個醫院。
36氪:現在國内大模型廠商在商業化上思路已經有分化,有的側重To B,還有的就只做To C應用。百川To B和To C都做,有側重嗎?
王小川:我們現在主要To C,To B占20%左右,很小的一個比例。
36氪:現在國内私有化部署的大模型,單價從原來千萬元級已經打到了百萬元甚至更低。我們可以說,國内To B市場天花板就是很低嗎?
王小川:To B确實比To C天花板低很多,現在大模型那麼卷,所以這個結論是對的。
另一個對我們的啟發是,如果你是模型廠商,沒有獨有的價值,這個遊戲就變成了拼價格的事情。
快速讓場景達到可用,才能成為壁壘
36氪:一年前百川剛成立時我們問過你,現在想再問一遍:現在中美在大模型上的差距有多大?
王小川:從0到1階段的一些創新,我認為差距是在拉大的。但已經突破了從0到1,技術接近可用的時候,我們是跟進得夠快的。
去年初,大家都特别擔心能不能跟上GPT-3.5,但今天,大家在問,什麼時候能到GPT-4?
無論是中國還是美國,大家的進步速度都不是跟中國公司相比。在美國,哪怕是Google等公司都有點跟不上OpenAI的狀态。OpenAI是現在人才、算力、資金的制高點。
36氪:這一年以來,你對AGI的實現路徑,或者認知和想法有什麼大的迭代?
王小川:理解沒有太大的變化。我們認為語言為中心,現在依然是。
我覺得更多是從願景走到實際的體感了。原來做模型的時候,你會有一種衝動和慣性,在模型之上,把我們原有的一些能力放進去,外挂一些應用。但現在很清楚,是要把這些能力要訓到模型裡面去。
36氪:可以展開講講嗎,把什麼樣的能力挂進去?
王小川:比如搜索,原來是像把搜索引擎挂到模型上,現在更多是想讓模型懂得怎麼用好搜索引擎。
36氪:用開源模型會是個問題嗎?國内無論是做AI應用還是說模型層,都有基于開源模型去做的。這會導致我們整體技術上落後嗎?
王小川:這不叫落後。美國很多公司也在用開源模型,開源、閉源,這兩件事都是生态裡很重要的事。在美國,如果不是Meta的LLAMA發布,讓開源這個生态打起來了,他們也只有閉源模型。比如我們自己的開源模型,Baichuan2-13B,也讓很多中國企業受益,用小模型+數據去做產品。
并不是開源落後的問題,而是需要去計算,到底什麼公司能夠既把模型scale(規模化)到接近OpenAI的水平,同時還能保證自己活下去,這是一個關鍵問題。
36氪:這一代生成式AI技術發展的瓶頸,或者說現在遇到的最大問題,會有哪些?
王小川:如果沿着Scaling Law繼續走,确實對能源消耗太大了,必須把成本降下來。
第二,現在有人提壓縮即智能,壓縮已有的數據,我們稱為分布内的數據,但分布外的知識、能力,要怎麼用進來?這是以OpenAI旗下Sora為代表的技術所不夠的地方。Sora雖然能力強,但計算能力要求高,而且處理的只是一種快思考,缺乏慢思考的基礎。
36氪:對于大模型,接下來你們要重點投入的資源會是什麼?
王小川:第一,要scale的話,大家都有共識,要數據、要算力。
并且,我們所說的三個世界裡:真實世界、虛拟世界,還有生命世界。每個世界裡,我們要去獲取和構造這個世界裡面需要的這些數據,更有針對性。
36氪:什麼才能造就壁壘,數據本身嗎?
王小川:是能夠更快地使場景達到可用狀态,而不是數據本身。
現在,大家每三個月到半年,你用一半的數據訓模型,只要是高質量好的數據,就能達成一樣的效果。
數據質量越高的時候,對規模的要求就變小了,那訓練成本也至少小一倍了。
36氪:錢也是重要資源。現在大廠的投資策略是廣撒網,誰都投,你怎麼看這種做法?
王小川:我覺得這就是大廠做貢獻,能推動進步的方式啊。一開始有人問我們為什麼不做人民币架構,做美元架構,也是有這個原因——我們一開始就覺得CVC(Corporate Venture Capital)是最該争取的,他們比純VC能更長久地支持這個賽道,政府的角色可能沒那麼快進來。
36氪:今年遇到的投資人裡,關心的問題會有什麼不一樣?
王小川:大廠更多關心算力夠不夠,VC關心場景咋樣。
36氪:2023年以前,大模型領網域融到大錢的公司就只有屈指可數的家,百川是其中之一。當時大家的融資規模大概都在3億美金上下。最近月之暗面的10億美金融資消息出來,是否意味着戰事規模更新了?
王小川:這是正常邏輯。大家都是認為往下是需要逐步去提升這個融資規模的,是行業共識。
36氪:對百川來說,融大錢也是很重要的下一步?
王小川:如果往AGI走,你是需要大錢的。但對我而言,我可能更看重超級應用,至少讓大家看到這個事,是有畫面感的。
36氪:就是沒有超級應用,這個大錢其實也不會來。
王小川:其實我們融的錢,按照現在的進度,也足夠支撐很長時間了,我覺得你比我焦慮多了。
36氪:這是我們感覺到的業界情緒。從去年下半年開始,投資人對大模型的态度變得更冷靜。你覺得呢?
王小川:肯定的。大家開始想超級應用在哪兒,否則一股腦地融資,如果沒超級應用,之後融錢也很難。
36氪:現在大模型在國内拿錢已經很不容易,你怎麼說服投資人再繼續給你投錢?
王小川:傳統VC确實很難繼續投錢,風險高、看不清。我覺得往後有兩撥力量,一是大廠,其實美國也是,Google、亞馬遜、微軟都這樣。二是政府,這不是靠風險投資邏輯驅動的。
36氪:今年,國内大廠會開始并購大模型公司嗎?
王小川:我覺得今年還不會。
36氪:但大廠都全都投了,還投了好多。
王小川:今天能入大廠眼的廠商,如果你做好了,你還能發展下去。但你做不好的話,人家也看不上你。
36氪:去年,全球AI圈裡,你覺得發生的最重要的事兒Top 3是什麼?
王小川:GPT-4發布是重大的裡程碑,比GPT-3.5有巨大的提升,而且後續每一代還會有。
其次是競争對手起來了,比如Anthropic、還有馬斯克的X.AI,不再是OpenAI一家獨秀。
還有一個事情是OpenAI内亂,這背後代表的是兩種技術思想的分歧,而且大家都不知道AGI什麼時候來,會造成多大影響。
36氪:這些事對國内來說是什麼信号?
王小川:首先對中國來說我們必須跟進,如果市場上只談商業化,那我們就完蛋了。
Sora不在AGI主線上,語言才是中軸
36氪:最近Sora讓全世界都又震撼了一次,你對Sora怎麼看?之前聽說團隊裡很多人和你說要去做Sora,你還發火了。
王小川:對啊,智力是藏在語言裡的。Sora既不是AGI,又不是應用。
大家肯定都有技術好奇心,有新東西總是想參與。但我坐在CEO的位置上,就是要做戰略道路選擇,決定做不做。
36氪:所以你覺得普遍已經超過GPT-3.5這個線了?
王小川:頭部這幾家大模型公司,包括大廠和創業公司,已經超過了。
36氪:你對Sora怎麼看?這對做LLM(大語言模型)的人來說,有什麼意義?
王小川:意義不大。
36氪:為什麼?
王小川:大家有一個誤解在于,覺得Sora好像比GPT又高級了,對吧?原來是文字的,啪一下,又變視頻了。
語言所表達的是概念層面的"空間",但視頻所表達的是肉眼可見的空間。語言對空間實體的表達能力,是遠高于視頻的。本質上,語言描述的概念,代表着對世界更多的認知。
Sora的突破在于,讓視頻上的表達和語言空間去統一編碼(即讓大模型将語言和物理意義上的空間表達進行匹配),而且還沒有完全解決這個問題。
36氪:畢竟視頻所對應的多模态技術,看着比較Fancy。
王小川:你講得特别對,Fancy。Sora的衝擊力更多來自于感官上的衝擊,但這并不代表技術是更強的。
GPT的技術難度,以及它可以實現的規模是遠高于Sora的。現在大模型到了萬億參數級别,Sora是百億級别,還是差很多的。
并且,OpenAI是要做AGI的,以後會陸續發GPT-4.5、GPT-5,但Sora只是OpenAI的side project(子項目),并不是主線。
36氪:人類所接收到外部信息裡面,語言當然是很大一部分,但影像這類視覺信息,不也是很重要的一部分嗎?
王小川:狗是會看視頻的,但狗會說話嗎?人類的智力是在語言裡面的。在實現AGI(通用人工智能)這件事上,視覺不是關鍵。
36氪:Sora的訓練其實也基于很多LLM(大語言模型)的技術,百川自己也有對多模态投入,會往Sora這個方向做嗎?
王小川:我們不會做。Sora既不是AGI這個方向的事,也不是一個具體可見的應用方向。現在Sora生成一分鍾視頻需要20分鍾,60美金,做電影可能有點用,但做C端一些互動性的東西,是不太實用的。
36氪:如果Sora不是你們的主線業務,那是誰的主線業務?字節嗎?
王小川:特别适合。這個事既沒有語言需要那麼多智力,又适合直接來跟進。
36氪:而且還特别耗錢。
王小川:哈哈哈哈。
大模型的未來不是工具,而是夥伴
36氪:我看到你在今年春節發了一個新年願景,是說造一個大模型時代的新物種,不會要求它像工具一樣,而是達到人類對夥伴的要求。這個新物種的載體會是什麼?
王小川:我覺得載體不是本質問題,但它以後一定會依附某種硬體,比如手機、眼鏡、耳機,都可以做。
36氪:如果復盤過去一年,你覺得做的最重要的事是什麼?
王小川:做得足夠早,和時代脈搏同步了。我們先是把團隊搭建起來了,并且現在模型能力接近GPT-4,在中文領網域很多任務是超過的。
我們對開源社區也有貢獻。去年9月份,我們發布了百川的開源模型,很多大廠還有創業公司都在用。我們得到的數據是,現在報備底層模型的200多家新公司裡,有一半以上都是用我們的模型。
并且技術主張和願景都沒有走偏,包括去年我提的"雙輪驅動",大模型和超級應用要一起做,以及增強搜索、強化學習等等方向,今年也會開始一一兌現。
36氪:你怎麼想象未來AI能做到的事情?
王小川:今年元旦,有朋友發消息給我說,小川元旦快樂。我就回復:智能紀元貳年快樂。
在我眼裡,去年是智能元年,今年是第貳年。我認為我是看到了未來的模樣。
去年4月我下場的時候,當時我就在講,AI一方面是提升這種生產力,另一方面能成為我們的夥伴,甚至還能創造出虛拟世界,成為大家娛樂的天地。
36氪:那些沒有被AI學到的數據,那就是AI的盲點,我想這對人類的創造力提出了全新的需求,我們也許不能創造出一個和AI差不多水平,或者人類已有知識庫裡存在的東西。
在現在AI的水平下,我們人類有價值的地方,或者應該發展價值的地方是什麼?
王小川:不同人選擇不一樣,比如創造力這個現在還是暫時取代不了。所以我覺得就做好兩個事情,一個是用好AI,你不會用,你就可能被淘汰。二是投身做AI,把智慧放進去,比如來百川做AI,哈哈。
去年我說了句有點争議的話,我說程式員也是自己的掘墓人,把自己融入進去了,從"小我"變成"大我"。
36氪:但融入之後,我們就會失業了?
王小川:人早晚都會死掉的,怕啥呢?
36氪:大家肯定想的是,死掉之前不要失業……
王小川:但你失業不失業,都要死掉,只有生死才是大問題嘛。
36氪:比如像真正做大模型的人,對未來可能創造出來的東西,你會有恐懼嗎?
王小川:沒有恐懼。我官宣下場的時候寫了句話:發展AGI,幫助繁榮和延續人類文明。這兩個任意選一個,都挺好的呀。
36氪:所以這兩個是可以分開看的。
王小川:對的。
36氪:想過有失敗的可能性嗎?
王小川:現在想的是解決各種困難。腦子确實裡沒有失敗這個念頭,最好也不要想這個事。
36氪:對于現在的AI行業,您最想知道的一個問題,或者看到的事情,是什麼?
王小川:我想看到GPT-4.5或者GPT-5到底有什麼大的變化,有多大的進步。
36氪:2024年,你對AI行業會有什麼預測嗎?
王小川:第一,我覺得美國還會不斷地冒出讓我們吃驚的進展。
第二,我覺得我們國内市場既不要狂妄,也不要妄自菲薄。我們已經能長出自己的能力來,GPT-3.5,GPT-4,我們是能跟上的。今年,各個廠商都會開始做差異化,我對這個比較樂觀。
歡迎交流
>