今天小編分享的教育經驗:對話王小川:人類進入AI新時代,歡迎閲讀。
輪值主編 | 智勇 責編 | 青羊
第 7415 篇深度好文:5905 字 | 15 分鍾閲讀
商業思維
筆記君説:
王小川的精彩觀點如下:
1、創業不是一個拼盤的過程,感覺好像拉幾個人,概念上放在一塊就行了。它是一個生命體,要不斷演化,一點點長起來。
2、我現在做的事是世界需要的,跟世界是連在一塊的,不是公司需要、部門需要或者只是同學們需要的,這是不一樣的。
3、機器掌握語言,強人工智能就到來了。當你沒有語言的時候,我們其實沒法去認知這個世界,語言的邊界就是世界的邊界。
4、OpenAI 需要特别自由的環境,甚至無目的性,不是為了賺個錢,或者為了有一種商業回報,就是對事情本身的好奇。這種情況本身就跟科學精神更一致。
5、搜索正好是 ChatGPT 的反面,細節都知道,抽象知識不會。ChatGPT 是抽象知識會了,細節全忘了。就像一個相對論,一個量子力學,合在一塊兒,才能構成更完整的一種智能。
6、OpenAI 的邏輯叫做理想大于落地。我們就要平衡這件事兒,理想上可以比 OpenAI 慢半步,落地要快半步。
ChatGPT 引爆一系列變革之後,給王小川的直觀感覺是 " 地動山搖,要變天了 "。
過去一個多月裏,幾乎每隔一段時間,甚至是每隔幾天,OpenAI 就有新的技術進展,從 GPT-4 的發布,到與微軟 Office 系列產品的結合,再到推出 Plugin 平台開放更多的插件,每天都在刷新人們的認知。
王小川對此的形容是 " 掉個渣兒都會產生很大的影響 "。
ChatGPT 也引發了國内的 AI 大模型創業潮。
在一系列的讨論中,王小川被認為是最有可能參與打造中國版 OpenAI 的候選人之一。
王小川是清華大學計算機系 96 級的知名人物,創辦了搜狗搜索,多年前就通過 AI 技術探索在輸入法、搜索、語音識别等應用。
更重要的是,2021 年 10 月,卸任搜狗 CEO 後,王小川一直在尋求指引他再次創業的那盞明燈。
一年零兩個月後,他終于看到了。
2023 年 1 月,王小川在試用 ChatGPT 後,意識到 " 強人工智能時代到來了 "。
僅 3 個月後,4 月 10 日,他正式官宣入場大模型創業,和前搜狗 COO 茹立雲聯合創立人工智能公司——百川智能。
目前,百川智能已獲得 5000 萬美元啓動資金,來自王小川與其業内好友的個人支持。
團隊擁有包括來自搜狗、百度、華為、微軟、字節、騰訊等知名科技公司的數十位頂尖 AI 人才。
不同于創辦搜狗,這一次創業,王小川把自己的名字寫進了公司名字中,他解釋:
" 百川不是我一個人,需要更多人來做這個事。"
每天,他花三分之一的時間找人,三分之一的時間學習。
他也非常有信心在年底做出中國最好的大語言模型。
過去十多年,王小川一直在關注人工智能的進展。
2016 年,在 AlphaGo 與李世石展開人機大戰之前,他就和幾位 AI 大佬打賭并預測 AlphaGo 會赢。
不過,從搜狗退出後,他把重心轉移到了生命健康領網域,這些年他讀了上千篇醫學論文。
關于缺失在人工智能語境中的那兩年,他告訴我們:
" 可能有人比我先淋到雨,但有可能他不覺得在下雨。但當雨滴滴下來之後,我第一個意識到,變天兒了!"
短短三個月,他用 ChatGPT 的次數已經明顯多于用搜索的次數。
針對 " 誰能在這場大模型競争中勝出 " 這個問題,王小川表示:
" 小創新大廠赢,大創新小廠赢。大廠的專注度和效率不一定比創業公司高,而且有追求的人可能在原有的地方也有瓶頸,這個事就适合用創新來做,我不覺得 AI 創新是專屬于大廠的事情。"
一、談 ChatGPT
當它能多輪對話時,我覺得要變天了
問:我們最近訪談了很多人,他們談到 ChatGPT 的時候,往往都有一個驚豔時刻,你有沒有這樣的驚豔時刻?
王小川:我們一直搞語言,搜狗當時也做了百億參數的大模型,但交給騰訊之後,我開始轉向把健康變成數學問題的研究,中間零零散散看到一些進展突破。
假如當時還在語境裏,我可能會更早敏感到這個事兒。
尤其記得當時,當你提個問題,一旦後面加了一個 prompt(提示詞)"think step by step(仔細想一想)",機器就答對了,我覺得好好玩兒。
到了今年 1 月,用了 ChatGPT 之後,當我開始追問它時,我就發現變天了。
它能夠用最自然的方法,根據我的提問回答,然後我再追加幾個字的問題,它能根據追問做調整,這個時候我就發現不得了了,通用人工智能時代已經到來了。
問:傅盛老對外講他問 ChatGPT,他的狗為什麼叫三萬的問題,随後讓他驚豔,你有沒有問這樣的問題?
王小川:我跟他們其實很不一樣。
我可能不需要一個特别能讓大眾理解的東西來觸動我。
我記得當時有個會,我和傅盛都參加了。
我當時就講,通用人工智能到來了,他還不信,還覺得我在裝。
但後來他打電話跟我説,小川,你太英明了,他也跟我説了三萬這個案例。
我的敏感跟大家不一樣,看到它能夠多輪對話了,我就覺得通用人工智能時代到來了,并不是需要三萬這樣一個驚豔的例子。
問:其實你很早就預言," 當機器掌握語言之後,強人工智能就到來了 ",會想到這麼快就被實現了嗎?
王小川:沒有這種時間上的概念。
剛好在技術突破的時候,我退出搜狗離開了這個語境,但當這個雨滴滴下來之後,我認為我是第一個意識到,變天兒了!
可能有人比我先淋到雨,但他不覺得在下雨。
問:國内這麼多年來一直在人工智能方面深耕,還有很多卓越的創業者,為什麼等到 ChatGPT 出來之後才恍然大悟?大家原來都忽略了哪一點,或者説不敢想?
王小川:本身這種原創性的想法,很多時候就發生在美國。
我簡單講,大家不是不敢做,是沒想法居多,特别到了工業界更是這樣子。
他有自己的業務目标,天天為了向老板怎麼匯報,天天琢磨收入,誰沒事兒琢磨這個呢?
但我想過。
AlphaGo 出來之前,大概 2013 年我已經在想 CNN 網絡(卷積神經網絡)能下圍棋,當時我就滿清華去找老師合作,想去做下圍棋這事兒。
系主任、黨委書記、所長、實驗室主任都找過,大家對這事沒有太大的衝動和熱情。
AlphaGo 出來之後,我有兩個斷言:
第一,機器掌握語言之後,強人工智能時代就來了;
第二,預測下一個由 AI 改變的是視頻。
我相信今天預測下一個由 AI 改變的是視頻這個事兒,也一定有人在死磕,因為這意味着你對物理空間有新的理解。
我覺得需要有這種腦洞,這個腦洞需要特别自由的環境,甚至無目的性,不是為了賺個錢,或者為了有一種商業回報,就是對事情本身的好奇。
這種情況本身就跟科學精神更一致的,去理解一種規律,跟商業世界确實比較遠。
問:即使最頭部的大廠意識到通用人工智能的機會,可能也沒有辦法持續投入?
王小川:沒錯。
這也是為什麼我覺得谷歌幹不過 OpenAI 的原因。
谷歌裏面的工程師,可能有這個想法,沒人有這個想法也組織不起來了。
二、談通用人工智能
語言的邊界就是世界的邊界
問:你在很多場合説過語言的重要性。你認為語言在人類的文明,包括未來智能文明當中,扮演的角色是什麼?
王小川:我之前説 " 機器掌握語言,通用人工智能就到來 ",就是把語言跟通用人工智能放在一個畫等号的位置上。
我之前從做搜索、做輸入法,都是以語言為核心。
我們小學上課的時候就知道,馬克思、恩格斯也講,人跟動物的區别,就是會語言、會使用工具。
我經常舉一個例子,有一件藝術品叫做 " 三把椅子 ":
一把真的椅子在這兒,一張椅子的照片,還有一個是椅子這個詞。
三把椅子,哪個才是椅子?
我們的第一反應可能都是,真正的椅子它是。
但是,我們去想,假設沒有發明椅子這個詞,人類沒有個概念之前,那你坐着的就是一個東西,你沒有辦法抽象成一個具體的功能載體。
當沒有語言的時候,我們其實沒法去認知這個世界。
維特根斯坦也講到,語言的邊界就是世界的邊界。
語言既是知識的載體,也是溝通的載體。
問:我聽到一種説法,之前的深度學習的方式更像是一個人學習外語的方式,現在這種大模型的學習語言的方式,更接近于學習母語的方式。
王小川:我是認同的。
其實今天的問題,是深度學習之上更大的一個復雜方式,區别在哪兒?
學外語的時候,你等于要重新挂一個模塊進來,通常是強迫你在迅速高密度地知道這種語料。
所以本身是大量的叫做監督數據或者标記數據裏去做映射,例如英文映射成中文,你再去學習它,這是我們通常學的一種方法。
我們之前做機器翻譯也是一樣的。
但今天的做法,是讓你先去書讀百遍,其義自見,就跟小朋友學習一樣。
第一天不是先教他學東西,而是先自由地到處看,他可能看到泡泡往上走、氣球往上飛會特别興奮。
他會很關注,然後去學。
他學的是世界上基本的規律,不是當成一個知識來學。
自然語言處理是人工智能皇冠上的明珠。
三、談行業變化
地動山搖,掉個渣都會有很大影響
問:AI 大模型出來之後,整個科技界就像打了一劑強心針,你身在其中,有什麼感覺?
王小川:地動山搖。
我認為這是一個大時代的變化。
我們已經走出了互聯網時代、信息時代,進入到了一個智能時代,這種情況下,掉個渣都會產生很大的影響,我覺得這是一種新的文明。
基礎大模型其實需要特别多的錢,但不妨礙在中間有各種開發,做各種事情,有很多垂直領網域的做法。
我不認為今天可能就只有這麼一件事情去做,有太多周邊垂直的事情,然後更有創造力的事情,都被發展起來,就像人類社會一樣。
問:現在 GPT-4 不是開源的,對于創業來説,這不是在源頭斷掉了?
王小川:局面很復雜。
微軟中國正在推雲上接口,排隊排得很長。
中小企業排隊,前面排了 15000 到 20000 個企業,還要先提前注冊,然後排到一個半月甚至兩個月後。
此外,你還要寫清楚,我的公司是幹嗎的,我的網頁長啥樣子,然後我調這個伺服器幹嗎用的。
對方審完了,才給你接口。
問:前段時間 OpenAI 推出的 Plugin 平台,将會產生一個非常大的作業系統、生态系統,你怎麼看?
王小川:今天大家都説要做中國版 OpenAI,但很少有把 ChatGPT 當成它一部分來看的。
其實 ChatGPT 特别重要,是 to C 以後最大的一種颠覆性的入口和人機互動界面,就像黃仁勳講,這是 iPhone 時刻。
這種情況下,ChatGPT 未來也會做增強,可能有不同的路線圖。
在我的想法裏,會去做搜索增強,你知道現在時效性不夠,以及會有實時性的東西缺乏,需要用搜索去跟它接。
搜索正好是反面,細節都知道,抽象知識不會。
這個抽象知識會了,細節全忘了。
就像一個相對論,一個量子力學,合在一塊兒,才能構成更完整的一種智能。
今天至少 OpenAI 的做法,就是一路狂奔,它不屑于把搜索當成一個老的輪子挂着,而通過 Plugin 的方式去解決,OpenAI 的邏輯叫做理想大于落地。
我們就要平衡這件事兒,理想上可以比 OpenAI 慢半步,落地要快半步。
問:這一波浪潮來了之後,搜索是在被海浪拍的最前沿的那個海岸線,是吧?
王小川:是的。
今天我用搜索的次數已經開始低于 ChatGPT 的次數。
問:你之前在做生命科學領網域,後來出來做大模型,這中間你自己的變化是什麼?
王小川:生命科學比這事更有理想,這個事今天做,十有八九只是覺得小川你适合幹。
説明這事是更現實的,是已經被别人突破了。
前幾年突破之前,中國其實也有一些人想做,但是理想堅定度不夠,或者受到局限。
生命科學更復雜,更遙遠,我認為健康本來就是數學模型,提了三個觀點:
第一,牛頓把物理學變成了數學模型;
第二,OpenAI 把語言變成了數學模型;
第三,我思考把醫療健康變成數學模型。
因此,我在選擇時也力圖在新公司裏,把醫療健康作為重要的組成部分。
四、談創業
這不是屬于大廠的遊戲
問:你大概在什麼階段決定正式籌備百川智能?
王小川:2 月份我開始認真想這件事。
問:你把名字融入到公司名字,這個事看來很不王小川,是表明自己要 All in?
王小川:對,以前做搜狗的時候,沒有這樣一種機緣。
這次來講,确實你説得對。
問:百川最核心的創始團隊怎麼達成的?吸納更多外部的人,還是找原來一些創業夥伴?
王小川:這是兩個問題。
首先,我是比較堅定一開始先從搜狗那邊來搭團隊。
因為創業其實不是一個拼盤的過程,創業是一個生命體,要不斷演化這種過程,是一點點長起來的。
所以,今天的時代不允許你開始由兩三個人一點點去找。
第二,搜狗的團隊離 AI 非常接近,很多人覺得無人駕駛是 AI,搜索不是。
其實搜索對 AI 的使用是非常多的,搜索也是數據、算力、算法,數據本身基本上是語言數據。
搜狗其實是在語言數據上,到今天為止最有能力掌握數據的公司。
此外,安全問題、意識形态問題等,搜狗也都是有成套的處理經驗。
問:探讨大模型創業,算力、數據、人才都是成本,如果拿不到足夠多的投資,實際上這個事沒法做。
王小川:不同的路線圖。
如果想做的是離 AGI(通用人工智能)最近的公司,那麼我預測是 3 億到 20 億美元的資金投入。
3 億只是入門的門檻。我們目前是選了對資金要求比較高的道路。
問:在路線圖選擇上有過糾結嗎?要選擇離大模型最近的一條,還是做離使用更近的?
王小川:雙輪驅動。
超級應用需要跟底層產生非常強的連接,如果沒有底座是沒有辦法支撐超級應用,在我心中大底座和大應用是相輔相成的。
問:具備什麼樣的素質才能選擇離大模型更近的路?
王小川:至少兩件事:
一是本身對技術有足夠多的理想,因為它就是很挑戰技術的活;
二是中間有一定體量的公司治理的号召力和能力,否則肯定不會做。
攝影:鄧攀
問:一端是對技術的理解,一端是對創業本身的理解。你説過有信心在年底做出中國最好的大語言模型,敢説這句話的人現在不多。
王小川:大廠的專注度和效率不一定比創業公司高,而且有追求的人可能在原有的地方也有瓶頸,説白了這個事就适合用創新來做,我不覺得這是屬于大廠的事情。
不知道大家怎麼看,我只不過長過一次教訓,比如搜索那一波。
最早搜索起來所有門户都做了一遍,搜狗是拆分完了好不容易活下來了,百度也活下來了,但是阿裏、騰訊也都沒有做成,而那還是可以看得見的成熟的東西。
但今天有巨大的變化,對于決策的專注度、靈活度、專業性都有很高的要求,歷史沒有告訴我們大廠可以幹這個事。
問:大家認為大廠,有可能是基于眼睛可以看到的,比如現在有多少 A100 的芯片,有多少人才,看起來像是大力出奇迹,你認同嗎?
王小川:上一輪搜索也不是當時的大廠跟進的,這一波 AGI 也不是大廠可以做到的,但大家都説大廠可以幹。
這個東西就是 " 小創新大廠赢,大創新小廠赢。"
問:現在大家都比較關注算力,其實數據高質量也很重要,如果數據質量比較低的話,算力再多最後也浪費了,你們在數據或者語料這一塊怎麼做的?
王小川:語料做搜索公司盡可能把公開的語料或者以前收集到的語料用起來,質量怎麼評價會做得更好一些。
問:現在在搭建下一步團隊的時候有什麼樣的标準?前兩天聽到説全世界的人都在挖 OpenAI 的人,但是沒有人離開,還有大量的人才往 OpenAI 去。
王小川:确實有距離,需要敬仰的一個狀态,現在人才儲備有兩條路,一是把國内最好的都能夠聚到一塊,甚至有好的效能把它發揮出來;
有機會再從硅谷摸到一點人或者認知。
我 4 月底會去一次美國交流學習。
問:你每天花在找人的時間多嗎?
王小川:三分之一,找到合适的人之後還要做溝通,三分之一的時間還要學習,每天新的技術、新的產品發布都需要時間去學習。
問:你常説包袱變輕了,但好像壓力變大了,怎麼理解?
王小川:現在做的事是世界需要的,跟世界是連在一塊的,不是公司需要、部門需要或者只是同學們需要,它需要的東西不一樣的。
确實是壓力變大了。
現在有太多創業需要整理的人和事,這個精力是遠遠不夠用的狀态。
* 文章為作者獨立觀點,不代表筆記俠立場。
掃碼成為筆記俠的朋友
領取商業實戰方法,迭代你的賺錢邏輯
分享、點贊、在看,3 連 3 連