今天小編分享的教育經驗:Scale AI華裔創始人:當前AI性能已停滞,主要由于“數據壁壘”;AI技術有可能成為比核武器更強大的軍事資產,歡迎閲讀。
第二期華夏基石數智時代領導力特訓營熱招中!
報名即送十月管理論壇參會名額1個,價值12800元!
來源 | Z Highlights,管理智慧
咨詢合作| 13699120588
圖片來源:20VC
盡管計算能力顯著提高,但自GPT-4模型發布以來,基礎模型的性能沒有顯著突破。當前AI性能的停滞主要由于"數據壁壘",即可訪問的互聯網數據已經被耗盡。要突破這一瓶頸,關鍵在于獲取更多多樣化和專業化的數據。基礎模型的性能瓶頸在于數據而非計算能力。要提升模型性能,需要為模型提供更多相關場景的數據。解決推理能力不足的方法包括開發通用推理能力或通過大量數據訓練模型。
雖然大型企業擁有大量數據,但大多是專有數據,不易獲取。生成合成數據和增加數據生產的手段是從數據稀缺到數據豐富的關鍵。數據的質量和結構是數據治理的最大挑戰,持續的數據生產對于AI的長遠進展至關重要。數據是AI模型可持續競争優勢的關鍵。未來,實驗室将通過數據策略進行差異化競争。大公司可能會采用内部部署模型,以保護其數據的競争優勢。
AI功能的商品化未必能提高定價或價值提取。軟體生產成本的下降導致企業軟體定制化程度提高。未來,随着AI agent和模型承擔更多工作,可能會從按座位定價轉向基于消費的定價模式。
過度嚴格的數據監管可能會抑制AI創新。更寬松的數據訪問政策與自由民主制度并不衝突,美國和英國需要采取措施确保不在數據生產上處于不利地位。AI技術有可能成為比核武器更強大的軍事資產。為防止負面後果,可能需要對最先進的AI系統采取封閉策略。
AI計算中的邊際效益遞減
Harry Stebbings:Alex,我很高興我們可以面對面進行這次對話。非常感謝你今天加入我。
Alexandr Wang:是的,很高興來到這裏。
Harry Stebbings:我之前發推文説我們應該跳過那些創立公司的故事,因為你已經講過很多次了。我想直接切入主題,問你一個問題。當關于當前的模型性能,我們先從高層次上來讨論,你認為我們現在是否遇到了計算力增加卻沒有帶來性能提升的收益遞減情況?
Alexandr Wang:是的,我認為這非常有趣。現在尤其是在GPT-4推出的情況下,事情變得更加明顯。OpenAI自2022年秋天以來就推出了GPT-4,從那時起,我們還沒有看到一個新的基礎模型或是一個比GPT-4更令人驚嘆的新模型。我們還沒有看到GPT 4.5或GPT 5,其他實驗室也還沒有推出明顯優于GPT-4的模型,盡管自ChatGPT問世以來,計算支出的增加是巨大的。你可以看看Nvidia收入的圖表。在GPT-4推出後,它的收入直線上升,從Nvidia數據中心的季度收入大約50億美元上升到現在超過200億美元。所以在同一時間框架内,已經有數百億甚至超過1000億美元被花在了高端的Nvidia GPU上。我們還沒有看到自GPT-4以來的大突破,而實際上這個模型是在Nvidia支出激增之前推出的。因此,我認為總體來説,這是一件非常有趣的事情,我們看到對計算的投資正在急劇增加,指數級增長,但我們作為一個社區、一個行業,仍然在等待下一個偉大的模型的出現。
Harry Stebbings:你認為我們是否已經達到了性能的一個極限,在等待突破的同時,性能會出現這種停滞?你認為這是一個短期的現象,還是像自動駕駛那樣?我們看到自動駕駛的性能停滞了好幾年,直到最近才再次有所突破。
Alexandr Wang:這是一件非常有趣的事情。這些人工智能模型有三個組成部分或三個支柱,分别是計算、數據和算法。人工智能的歷史表明,進展來自于這三個支柱的共同進步。因此,你當然需要大量的計算能力,但你也需要算法的進步,比如最初的Transformer、RLHF,或者未來的算法進步。而且你還需要數據支柱。我認為我們最近看到的性能停滞在很大程度上可以用我們碰到的數據牆來解釋。GPT-4是一個幾乎訓練在整個互聯網上的模型,使用了巨大的計算能力。而我認為在過去幾年裏,整個行業所做的主要是在計算方面進行了大規模擴展,但并沒有同步在其他兩個支柱上取得進展。因此,我認為需要更多的算法改進,但特别是我們需要确保有更多的數據來支持它。
Harry Stebbings:當你説到數據牆時,這到底是什麼意思?我們可以做些什麼來克服它?
Alexandr Wang:從一個非常高的層次上講,我認為我們已經用盡了所有的"簡單數據",我們已經用盡了所有的互聯網數據,比如Common Crawl以及它的最新版本。
Harry Stebbings:為了讓我們理解,所謂"簡單數據"就是指社交媒體上的内容,任何不在付費牆後面的東西,任何容易且免費的内容。
你希望人工智能系統能夠完成任務,能夠解決復雜問題,能夠與人類合作來解決日常問題。而構建具有這些能力的智能體和人工智能模型的過程,我們不能僅靠互聯網數據來實現。而我們已經用盡了所有的互聯網數據。
Harry Stebbings:當我們考慮到有效的agents和執行工作的軟體,而不只是工具的銷售時,正如Sarah Tavel(Benchmark 普通合夥人)也曾指出,為什麼現有數據不足以支撐從工具轉向工作的轉變?
Alexandr Wang:簡單的答案是,人類在執行更復雜任務時所進行的許多思考過程并沒有記錄在互聯網上。例如,如果我是一個大銀行的欺詐分析師,我的工作是根據一組看似可疑的交易判斷它們是否是欺詐交易。我需要分析各種不同的數據,運用我的推理能力和所有的人類智能來做出這個決定。而我進行這個過程時,并不會每一步都寫下來,比如,我查看了這塊數據,又查看了那塊數據,然後基于這些數據得出了結論。我不會把這些步驟寫在互聯網上供這些模型以後爬取。因此,簡單來説,支撐當今經濟的所有推理和思考都沒有被記錄在互聯網上。如果你只在互聯網上訓練模型,它就沒有能力從這些過程裏學習。
Harry Stebbings:那麼,我們如何将這些未被記錄的數據捕捉下來,就像你剛才提到的欺詐分析師的思維過程、分析和内部會議中的讨論,這些内容并沒有被編入數據集。我們如何捕捉這些數據,以便能更好地執行任務?
Alexandr Wang:我們的觀點,或者説我真正相信的是,我們從現在開始需要的是前沿數據。我們需要大量的前沿數據,而目前我們處于一種數據稀缺的心态,或是我們已經觸碰到數據牆。而前沿數據在我看來包括復雜的推理鏈、復雜的讨論、模型進行的推理鏈、模型查找數據、進行推理、查找另一個數據、可能糾正錯誤,工具使用等所有我們認為智能體能夠執行的關鍵部分。所有這些都需要被封裝在前沿數據中,以推動這些模型的前進能力。
Harry Stebbings:我們如何捕捉這些數據?
Alexandr Wang:我認為這需要通過基本上三大支柱的結合來實現。首先,今天世界上的企業内部有大量的數據被鎖定,因合理的理由,這些數據并未公開于互聯網。為了給大家一個規模的感知,舉例來説,摩根大通的專有内部數據集為150 PB,而GPT-4的訓練數據集不到1 PB。因此,大型企業内部存在的數據量非常龐大,有一個過程就是挖掘這些現有企業數據中的所有優質數據。
Harry Stebbings:但這些數據永遠不會是開源的,對吧?這些都是專有的,專門為該客户定制的。
Alexandr Wang:确切地説,這是一個每個企業都要經歷的過程,比如我有一組對我的企業非常重要的問題,那麼我就需要經歷一個過程,基本上就是挖掘我所有的現有數據,并精煉這些數據,以供人工智能系統解決我的問題。
Harry Stebbings:當我們思考突破時,我們一開始談到了收益遞減的問題,我前幾天和世界上最有權力的首席技術官之一交談時,他説,在解決收益遞減的問題上,真正的突破在于我們能否真正解決推理問題。你如何看待我們解決推理問題的能力,以及你提到的數據在幫助我們應對這一挑戰方面的影響?
Alexandr Wang:如果你看看這些模型能做什麼,它們在以前見過很多數據的情況下非常擅長推理。我們傾向于将這些AI視為類似于小型人類智能,但它們非常不同。人類智能和機器智能是非常不同的。人類有一種非常通用的智能,他們有一種很棒的能力。如果一個孩子在一個非常小的社區長大,他可以一生都在那個小社區生活,也可以去世界上完全不同的地方,并且能夠适應和理解那裏的情況。
今天還沒有任何一個AI系統能夠達到這種水平的能力,即從一個環境"拖放"到另一個環境中,并弄清楚發生了什麼。因此,我認為我們必須認識到這是一個限制。但這意味着,對于我們希望這些模型在某種情況下表現良好的任何情境,我們需要有該情境或場景的數據,實際上模型在這種情況下會表現得非常好。
所以有兩種方式可以解決這些模型中存在的推理差距。一種顯然是構建某種通用的推理能力,這肯定會是一個重大突破。另一種方法就是,這是一個數據問題。你需要為每個希望這些模型在其中推理良好的場景提供數據,你需要在所有這些場景中用數據壓倒它們,你就會得到能夠很好推理的模型。
數據獲取與治理的前沿探索
圖片來源:Unsplash
Harry Stebbings:我們如何從數據稀缺的環境過渡到數據充裕的狀态,特别是考慮到像摩根大通或高盛這樣的企業擁有巨量數據,但這些數據的專有性質使得它們無法用于通用模型,從而無法惠及全球或推動突破性進展。我們如何從數據稀缺過渡到數據充裕?是通過生成合成數據嗎?我們該如何思考這個問題?
Alexandr Wang:我認為你説的第二部分很重要,即需要產生新的數據,我們需要生產新的前沿數據的手段,這樣才能從GPT-4進展到GPT-10。我認為,當我們談到芯片時,這種思路很自然,我們需要建造越來越多的晶圓廠,建造更大的晶圓廠,我們需要提高分辨率,制造更小納米級的晶圓廠。當涉及到計算能力時,我們很自然地想到要增加生產手段,但我認為我們在數據方面并沒有這樣去思考。我們需要在數據方面做類似的事情,數據的生成過程是一種混合的人工與合成的過程,這也是我們思考它的方式。你需要一些算法來承擔大部分生成合成數據的工作,但你也需要人類專家來引導這些AI系統,幫助它們在遇到困難時或在處理未曾遇到的情況時提供輸入。另一種思考方式是,很多自動駕駛的擴展都是通過這些安全駕駛員來實現的,汽車内部有安全駕駛員,當汽車開始出錯時,安全駕駛員會接管控制,我們需要為這些AI系統設定類似的機制,你需要AI模型生成大量數據,然後人類可以在必要時介入,推動模型的進展,以确保獲得高質量的數據。
Harry Stebbings:在組織結構中,這種做法會是什麼樣子?我們是否會為這些AI提示創建新的角色,不是提示員,而是類似于數據監護員?
Alexandr Wang:是的,訓練員是一個術語,AI訓練員或貢獻者是另一個術語。
Alexandr Wang:向AI貢獻數據實際上是人類能做的最有杠杆作用的工作之一。原因是,如果我是一個數學家,我可以選擇閉門研究純數學,做純數學研究,這是我人生的一條軌迹。另一條軌迹是,我可以利用我的所有技能、才能和智慧,幫助這些AI模型變得更聰明。即使我只是讓GPT-4在數學方面稍微聰明一點,如果我将這種微小的改進匯總到GPT-4在未來所有被調用和使用的場合中,比如所有使用GPT-4的數學學生,所有使用GPT-4的開發者,那将產生巨大的影響。因此,作為人類專家,你有能力通過生產數據來提高這些模型,從而對社會產生廣泛的影響。這對于科學家、數學家、醫生以及世界上的其他人類專家來説,我可以将我的能力、智慧、訓練全部傳輸到一個能夠對社會產生廣泛影響的模型中,這是一個非常令人興奮的前景。
Harry Stebbings:我們如何看待數據的結構?人們經常談到數據治理的最大挑戰其實就是數據的結構和整潔性。考慮到摩根大通擁有150 PB的數據,我不确定,但我猜測這些數據并沒有為很多模型的高效使用而完美地結構化。我們如何看待這些大型企業擁有的巨大數據集的結構化問題?這對這些企業來説意味着什麼挑戰?
Alexandr Wang:這裏有兩個并行的努力方向。一是現有數據的挖掘,盡管如此,這會是一次性的,你從挖掘現有數據中獲得的收益可能會很有意義。
Harry Stebbings:你認為在五年内,每個企業都會挖掘他們内部最大的數據庫嗎?
Alexandr Wang:我不認為每個人都會這樣做,但肯定最先進的公司會這樣做。然後,我們還會處于一個仍然需要讓模型變得更好的階段。因此,最終一切都歸結為數據的生產,類似于你需要芯片等其他關鍵物品的生產手段。
Harry Stebbings:好的,那麼我們談到了挖掘現有數據,你説還有另一種方式。
Alexandr Wang:是的,有數據挖掘,然後是前瞻性的數據生產,這是我們需要數據來源的兩個核心方向。我認為,如果我們退一步,從更廣泛的角度來看,當前AI進展的一個根本瓶頸是數據。如果我們能夠在計算和數據生產上同步進行,比如在Nvidia繼續制造數百億美元的芯片的同時,我們也能生產出與之相當的數據量,那麼我們将獲得極其強大的模型能力。
Harry Stebbings:為了更好理解,當我們考慮增加數據供應時,具體的做法是什麼?我想到的是像Limitless這樣的項目,不知道你是否知道Limitless的Dan,他是Optimizely的創始人,他有一個新的硬體設備,記錄你説和做的每一件事,并生成你個人的AI,因為它記錄了你一天中的所有言行。這在我看來是一種新的數據生成形式。我們如何增加數據供應?
Alexandr Wang:主要有兩個部分。一是像Limitless這樣的努力,基本上是更長期的數據收集,收集更多自然發生的世界數據。這有很多形式,比如在工作場所,你可能需要某種持續的數據收集,盡管聽起來可能有點吓人,收集你使用的應用程式、使用的順序、從一個地方復制粘貼到另一個地方的内容。
Harry Stebbings:很多與RPA和許多IPO流程相關的内容。
Alexandr Wang:是的,完全正确。這就是SaaS中的流程挖掘術語的來源,基本上是對現有企業流程的持續收集。然後是消費者版本,可能類似于你提到的,或者像Meta與Ray-Ban的合作,或者任何最終用于此的設備,但大致是收集你個人生活的長期視角。除此之外,還需要真正投資于人類專家與模型的合作,以生產前沿數據。因此,我之前提到的企業流程挖掘和消費者數據收集,都會產生有價值的數據集,但它們不會推動模型向前發展。
因為要推動模型向前發展,我們需要非常復雜的數據,能夠推動模型能力的前沿。這就是你需要智能行為的地方,這就是你需要復雜推理鏈的地方,這就是你需要高級代碼數據或高級物理學、生物學或化學數據的地方。這些才是真正需要推動模型邊界的内容。我認為這需要全球範圍内的基礎設施級别的努力。我們需要思考如何讓世界上的專家與模型合作,幫助生產出世界上最好的AI系統,讓它們成為世界上最好的科學家、最好的程式員或數學家。
AI商品化浪潮和差異化數據策略
Harry Stebbings:當我們思考模型的商品化時,大家都説我們已經達到了這一點。那麼我們如何看待這些數據源的專有訪問?有人以前跟我説過,我無意批評,但像OpenAI的模型不一定更好,只是因為他們獲得了更好的數據,他們購買了更多的數據等等。而數據是他們過去性能優越的核心優勢因素之一。那麼我們是否會看到某個模型獲得其他模型無法獲得的數據訪問權?我們如何看待模型側的公平和公正的數據訪問?
Alexandr Wang:我認為,如果你考慮這些不同模型提供商之間的競争格局,數據确實是少數幾個支柱之一。總共有三個支柱:算法、計算和數據。我認為數據實際上是你可以想象出持久競争優勢的主要支柱。所以,如果你想知道在這個領網域裏,基礎模型競争遊戲中的護城河在哪裏,我認為數據是為數不多的可以產生可持續護城河的領網域之一。因為問題在于,算法是知識產權,某個時間點上,整個行業都會了解它們。計算能力,你可以比别人有更多的計算能力,但别人也可以花更多錢去購買相同的計算能力。而數據是少數幾個領網域之一,你可以真正產生長期可持續競争優勢。
Harry Stebbings:我同意,看看OpenAI的一些合作協定,他們顯然與《金融時報》合作,獲得了《金融時報》所有歷史文庫的訪問權限,他們還與Axel Springer進行過幾次合作。我認為這些是其他很多模型沒有的訪問權限,這使得他們的内容在特定查詢中表現得更優越。
Alexandr Wang:是的,完全正确。我認為這是結構的一部分,把數據視為護城河的思維方式。我認為這些合作——《金融時報》和Axel Springer——只是初步迹象,但未來我認為這些實驗室會非常重視這一點。他們會思考,我将使用什麼數據來與競争對手區分開來,我将如何生產這些數據,以及這些數據會創造出什麼樣的長期持久優勢。因此,我認為你會看到,我實際上預計,圍繞數據和模型商品化的一切,我們将看到公司開始構建數據策略,随着時間的推移,這将推動市場中的更多差異化。我認為這很令人興奮。另一種思考方式是,現在在舊金山,重要的研究人員和CEO都在炫耀他們擁有多少GPU,這幾乎成了他們在AI領網域有多認真對待的最大指标。但我認為在未來,他們會炫耀他們可以訪問哪些數據,他們生產了多少數據,他們對不同數據源的獨特權利是什麼。我認為這實際上将成為未來的主要競争領網域,而不僅僅是炫耀"Jensen給了我多少GPU"。
Harry Stebbings:考慮到數據策略可能成為赢得競争的一個關鍵因素,你認為我們将不會看到這些模型逐漸商品化嗎?
Alexandr Wang:有兩種未來。一種是即使數據策略也會很快被商品化,不同的人和不同的實驗室會相互模仿,或者他們最終會走向同一個方向。
Harry Stebbings:完全同意,尤其是對于許多内容生產者來説,他們不太可能與某一個模型籤訂獨家協定,而忽略其他模型。
Alexandr Wang:是的,所以我認為這就意味着不同的實驗室需要制定策略,以生產他們獨特的數據集。比如説,我舉個例子,Anthropic專注于企業應用場景,他們可能需要制定一個數據策略,使他們能夠在這些企業應用場景中獲得非常差異化的新數據訪問權限。或者OpenAI與ChatGPT可能需要制定一個獨特的數據策略。我認為,各個實驗室需要傾向于他們能夠在未來獲得專有和差異化數據的領網域。
Harry Stebbings:你認為我們會看到企業重新回歸本地部署嗎?雖然我的問題跳來跳去,但我很喜歡這個對話。抱歉這麼多跳躍式的問題,但當我們考慮到像摩根大通那150 PB的數據時,我不确定他們是否願意将所有最敏感的數據都放在雲端。你認為我們會看到企業重新回歸本地部署,并為這些大企業提供本地工作的模型嗎?
Alexandr Wang:當我們與這些大企業和他們的領導者交談時,他們很快就意識到你提到的這個事實:他們的企業數據可能是他們在AI世界中唯一的競争差異化因素。因此,他們在處理這種情況時極其謹慎。如果他們達成了一項交易,所有的數據不管以什麼方式,模型開發者都能獲取到,或者他們以某種方式共享數據,那麼他們可能就是在抵押他們的整個未來。所以我認為他們對此非常非常謹慎。這實際上也是為什麼我認為無論是開源模型還是Llama模型,還是Mistral模型,這些可以在本地部署并讓企業能夠在其自身數據之上進行定制的模型都有非常大的機會。這樣的話,這些數據永遠不需要返回給模型開發者或雲端。我認為在這一領網域有巨大的未滿足需求,我認為這是大多數嚴肅的企業将要去的方向,即"這是我的數據,我需要非常非常強有力的保證,我的數據不會被用來提高我的競争對手的能力。"
Harry Stebbings:我認為AI服務實際上會創造更多的收入,這沒問題。我們看到Accenture最近宣布他們的生成式AI收入達到24億美元,而OpenAI顯然達到了20億美元。你如何看待現在的Scale AI以及與一些大企業合作的服務組件?學習和采用曲線對大企業來説是一個挑戰。你認為這是未來幾年中你的核心業務的一部分嗎?特别是在我們擴展教育的過程中?
Alexandr Wang:首先,我認為你是對的。AI确實可以產生巨大的價值,但問題是,這種價值的捕獲将在哪裏發生?這個問題很有趣。如果你回頭看看Andy Grove(Intel第三任CEO)寫的《高效管理》一書,書中有幾章提到,例如在Intel公司,當時我們認為價值捕獲會發生在某個部分,但後來我們意識到,它會發生在堆棧的另一個部分,所以我們不得不遷移到那個部分,然後我們又得再次遷移。這是一個非常令人難以置信的案例研究。我記得我大約十年前在一個不同的技術時代讀過這本書,當時我覺得這有點奇怪,感覺不太相關。而現在在AI領網域,你再次看到這種情況。我認為AI領網域如此新穎且初步,價值到底會在堆棧的哪個部分累積,感覺它在不斷移動。我同意你的看法。
模型本身有很多競争,所以我不确定在模型本身會累積多少價值,但我非常有信心,在模型之上和模型之下的所有事物都會累積價值。在基礎設施方面,Nvidia是今天在AI領網域建立的最大的公司,它是世界第三大最有價值的公司。Nvidia比Meta、Google、Amazon和沙特阿美的市值都要高,真是令人驚嘆。這是一家令人難以置信的公司,這些都是模型之下的部分。而在模型之上,你将會有所有這些在其上構建的應用程式和服務。
Harry Stebbings:今天早上我在路上和别人争論,我在説,好吧,Notion AI和Box這家存儲公司将AI解決方案整合到他們現有的存儲產品中,以便更好地提取信息。但是,你有沒有注意到Salesforce的增長現在只剩下個位數,MongoDB的增長也只剩下個位數。重點是,功能的商品化意味着我們會得到更好的產品,但我不确定這是否會以提高價格的形式實現價值提取。你怎麼看?
Alexandr Wang:我們的觀點是,有一篇文章The End of Software讨論了"軟體的終結"。
Harry Stebbings:我看到了,是Chris Paik(Pace Capital 的創始合夥人)寫的。
Alexandr Wang:這是一個有意挑釁的觀點,但我确實認為其中有一些内容是正确的。
Harry Stebbings:為了那些沒讀過的人,你能簡單概述一下這篇文章的核心觀點嗎?
Alexandr Wang:他基本上做了一個很巧妙的比較,他把今天的軟體公司與社交媒體之前的媒體公司進行了對比。大致的比較是,在過去的媒體時代,有許多非常出色的媒體公司,這些公司由許多專家組成,生產出高度差異化的内容。但後來,這些公司被社交媒體和互聯網廣泛的傳播所颠覆了。随着内容創作成本的降低或内容分發成本的急劇下降,媒體消費的世界變得非常廣泛,你可以随時消費任何你感興趣的人生產的内容,而不再是被大媒體生產者所主導。這個比較的核心是,這就是即将發生在軟體領網域的事情。現在,企業生活在一個由少數幾個軟體提供商主導的圍牆花園中,但随着生成式AI和其他趨勢的到來,未來他們将擁有一個由不同應用程式和點解決方案組成的星座式結構,我們将從當前少數圍牆花園SaaS應用的世界轉向一個更加去中心化的宇宙。
Harry Stebbings:你同意這個觀點嗎?
Alexandr Wang:這确實是一個有意挑釁的觀點,但我認為有一點是正确的,那就是企業和整個世界将會要求更高水平的定制化和個性化,他們會要求專為他們的業務量身定制的東西。我認為,這一趨勢的開端可以追溯到第一個在這方面做出嘗試的科技公司Palantir。長期以來,Palantir一直被誤解為僅僅是一家咨詢公司,但Palantir的觀點也具有挑釁性,他們認為,我們的任務是進入企業,深入了解他們的問題,然後幫助他們構建完美的應用程式,這些應用程式可以連接他們所有的數據和其他内容。如果我們能做到這一點,我們将為他們構建出比任何其他軟體提供商都更有價值的東西。他們在生成式AI和所有這些工具出現之前就已經開始這樣做了,這些工具使得這種方法變得更加可行。但我确實認為,世界正在向這個方向發展,特别是現在軟體生產成本和軟體創作成本正在急劇下降,我們将走向一個企業消費的軟體越來越多是為他們的特定問題量身定制的世界。
Harry Stebbings:這對大型企業的工程團隊結構意味着什麼?他們的規模會縮小嗎?他們會專注于不同的事情嗎?我們會有世界上最好的提示工程師組成的團隊嗎?這對工程團隊的結構變化意味着什麼?
Alexandr Wang:我認為,軟體工程總體上會發生巨大的變化。今天開發人員花費大量時間的許多工作,随着模型在編碼方面越來越強,他們将不再需要花費那麼多時間。但是他們所做的某些重要部分是不可替代的。随着時間的推移,我認為特别有價值的一部分是從客户問題或需要解決的問題開始,将它們轉化為工程問題,并将其分解為可以由AI工程師解決的任務。
Harry Stebbings:每個人都在説我們将看到按座位定價的終結。就像Chris在那篇文章中提到的,大家都在讨論按座位定價的終結。在這個新一波軟體浪潮中,尤其是在數據方面,我們是否會看到更多基于消費的定價模型?你認為這真的會取代按座位定價嗎?
Alexandr Wang:按座位定價在未來不再合理的原因是,在今天的企業中,大部分有生產力的工作确實是由員工完成的,由人完成的。但是在一個你可以想象更多工作由AI agent或AI模型完成的未來,按座位定價就不再合理了。因為作為軟體或解決方案的提供者,你希望确保你所提供的價值不僅僅是針對人,還包括你所提供的AI agent或AI系統所產生的價值。所以我認為,這将把世界大大推向基于消費的定價模式,而不是按座位定價。
數據監管與AI軍備競賽
Harry Stebbings:我最大的擔憂之一顯然是我們在倫敦。我們在很多方面都很擅長,比如長時間的午休和監管。不過,我的問題是,我真的很擔心我們會因為消費者數據保護法和關于數據訪問的不必要監管,而看到創新受到抑制。你認為我的擔憂有道理嗎?你如何應對數據訪問的監管問題?
Alexandr Wang:這是一個非常重要的問題。我認為我們在歐盟看到的情況确實是對數據采取了非常嚴格的态度。
Alexandr Wang:我個人的看法是,我不認為圍繞數據的更寬松的監管與自由民主制度不兼容。更自由的數據訪問規定實際上與自由民主制度非常兼容。我們作為一個社會整體需要找到一個合适的平衡,并解決這一矛盾。但我認為這是一個非常重要的問題,因為在美國,有大量的努力和真正的監管努力,旨在确保我們不會放慢芯片生產的速度,确保我們能夠繼續制造大量的芯片,而美國不會因此處于不利地位。從這個角度來看,我們需要對數據采取類似的視角。因此,從政策角度來看,無論是在美國還是在英國,我們都需要思考如何确保作為國家,我們不會在未來數據生產方面自縛手腳。
Harry Stebbings:你認為美國目前在這方面是否自縛手腳?
Alexandr Wang:我們顯然沒有采取支持數據的監管立場。
Harry Stebbings:那麼,支持數據的監管立場會是什麼樣子?
Alexandr Wang:有幾件事我認為是重要的。首先,有一些大型數據集不應給特定的參與者帶來專有優勢,它們需要被集中并對整個行業開放訪問。一個簡單的例子是航空航天領網域的安全數據,這是一個熱門話題,但航空航天領網域的安全數據應該被集體共享,以推動整個行業向前發展。再比如我之前提到的金融服務中的欺詐和合規數據,也應該被集中起來,并用于推動未來的能力發展。因此,我認為在整個工業部門中,應該在某種程度上進行數據共享,以推動整個行業的發展。
Alexandr Wang:此外,在很多面向消費者的領網域,我們需要解決現有的許多限制,确保這些限制不會阻礙AI的進步。一個很好的例子是醫療保健領網域的HIPAA法規以及所有的個人身份信息(PII)限制。目前,HIPAA法規和PII規定或多或少會阻止患者數據被用于訓練AI模型。但我認為,作為一個文明社會,作為人類,我們真的希望從現有的醫學數據中學習,找到未來治療人類疾病的方法。因此,我們需要找到解決辦法,比如制定非常明确的匿名化條款,或者找到一種非常清晰且顯而易見的方法,利用現有的患者數據來改善未來的健康結果。
Harry Stebbings:有一種説法,中國在人工智能進展方面落後美國大約兩年。我不記得是誰在節目中提到的這個觀點,但我當時聽到後覺得這簡直是胡扯。我認為,考慮到中國政府在數據訪問、數據提供和監管方面的做法,如果他們确實落後兩年,那他們會很快趕上來。你怎麼看中國落後兩年這個説法?你同意嗎?
Alexandr Wang:兩年前,他們可能确實落後了兩年。當OpenAI第一次在實驗室中推出GPT-4時,中國遠遠沒有達到那個水平。但即便在過去幾個月裏,一家中國公司零一萬物推出了一個名為Yi-Large的大模型,這個模型現在是世界上最好的模型之一。我認為它僅次于GPT-4o、Gemini、Claude 3 Opus,是排行榜上排在這些模型之後的下一個模型。所以它是世界上最好的模型之一。我們已經看到他們在迅速地趕上來。中國的語言模型和人工智能能力現在基本上已經與美國的能力非常接近了。
如果你根據我們之前談到的所有數據來預測未來的路徑,我認為他們有明确的機會趕超我們。這歸根于,中國共產黨體制非常擅長采取非常激進的集中行動和集中工業政策來推動關鍵行業的發展。我們在過去幾年甚至幾十年裏都看到了這一點,特别是在太陽能領網域,中國或中國共產黨能夠通過工業政策,在很大程度上成為全球太陽能領網域的領導者,最近在電動汽車領網域也是如此。你會看到中國共產黨的體系和方法創造了非常便宜的產品。我們一次又一次地看到這種模式的重復,中國共產黨的工業政策方法不是最具創新性的,但一旦一個行業已經建立起來,他們在推動其發展方面比世界上任何其他經濟體都要強大。
Harry Stebbings:完全同意,我昨天看到了一個圖表,我不記得是誰發的推文,我認為可能是Elon Musk或Bill Ackman(Pershing Square Holdings的創始人兼CEO),圖表顯示了不同國家在制造業方面的表現。如果沒有通用汽車,美國的制造業可能會陷入困境,而中國的表現則顯然是一路向上。你對此感到擔憂嗎?
Alexandr Wang:我非常擔憂。我認為我們在人工智能社區很少讨論的一個重要話題是,這項人工智能技術有潛力成為人類有史以來最強大的軍事資產之一。
Alexandr Wang:你可以想象,如果一個國家擁有AGI,而另一個國家沒有AGI,哪個國家會在戰争中獲勝?很可能是擁有AGI的國家,因為它可以開發出所有的武器,或者制定出卓越的軍事戰略,或者能夠入侵另一個國家的系統。這可能是世界上有史以來最強大的軍事資產,甚至比核武器還要強大。如果你考慮到這一點,我們現在所處的地緣政治環境正變得越來越緊張。過去幾十年世界上的衝突在單調地增加。我們看到世界上發生了多場戰争,其中一些戰争沒有明顯的解決途徑。而且現在世界上有一些極權主義領導人,比如説,如果今天中國或俄羅斯擁有AGI而美國沒有,我認為他們會利用這一點進行征服。
Alexandr Wang:這對整個世界來説是一個非常可怕的結果,我認為這是西方世界需要投入大量思考和努力去防止的結果。
Harry Stebbings:鑑于這種擔憂,我們是否應該采用封閉系統?顯然,開放系統有很多好處,但開放系統的挑戰在于任何人都可以使用它們。這意味着俄羅斯、中國都可以使用它們,每個人都可以獲得相同的訪問權限。我們是否應該采用封閉系統,考慮到你剛才所説的内容?
Alexandr Wang:我認為這裏必須出現一種二元對立。我們需要考慮最前沿和最先進的系統,那些我們出于地緣政治原因、軍事原因或其他原因想要确保維持封閉的系統。當我們開發出真正強大到如此程度的系統時,我們會希望将它們保持封閉,但這并不妨礙我們開發不太先進的開放技術版本,這些技術實際上能夠帶來巨大的經濟價值。我認為這就是我們現在在Llama模型中的位置。我不認為Llama 3模型已經先進到可以被視為軍事資產的地步。我認為在某個界線以下,開放模型完全沒有問題。我認為我們需要謹慎思考的是,這個界線在哪裏,我們什麼時候接近這個界線。
Harry Stebbings:在我們讨論一些公司建設原則之前,我确實想談談十年後的基礎模型會是什麼樣子?誰會保持獨立,誰會被收購,這個領網域會是什麼樣子?
Alexandr Wang:我認為,基礎模型競争的核心在于其成本極其高昂。這些模型的成本已經從幾億美元增加到十億美元,甚至可能是幾十億美元。我認為在十年後,它們的成本可能會達到數十億或數百億美元。因此,能夠擁有如此巨大的資金和自由裁量權來投資這些AI模型的實體非常少。随着時間的推移,自然會發生的事情是,AI的基礎努力将逐漸圍繞國家或大型科技公司聚集。因此,你會看到,所有這些超級盈利的商業模式,無論是國家還是超大規模企業,都是唯一可能為這些龐大的AI項目提供資金支持或擔保的實體。因此,我認為未來的情況看起來就像是一場巨人的戰鬥,現在已經是這樣了,但到那時,這場戰鬥會更加激烈。
Harry Stebbings:那麼,你是否同意我的看法,即所有較小的玩家都會被大型雲服務提供商收購,比如Google、Amazon、Nvidia,以及其他你能想到的大型公司,尤其是大型雲服務提供商,并将它們整合到現有解決方案中?
Alexandr Wang:是的,不過可能需要加一個星号注釋,有些合作夥伴關系我認為會很有趣,看看它們如何發展。比如OpenAI和微軟的合作,或者Anthropic和Amazon的合作。我認為這個技術時代最有趣的問題之一是這些合作夥伴關系在長期内究竟會如何發展。
品牌力量構建
Harry Stebbings:我确實想讨論一些公司建設的原則。我們從這個開始,我記不清你在PR方面説的那句精彩的聲明是什麼了,你説的是"最好的PR是不做PR",你這是什麼意思,Alex?
Alexandr Wang:傳統的新聞行業并不特别有利于建立偉大的公司。更具體一點來説,許多傳統媒體主要是為了獲取點擊量,因此傳統的新聞引擎會在你上升時大肆宣傳你,生成大量點擊量,而在你下滑時則會打壓你,繼續通過這種方式獲得點擊量。這與20VC和其他類似的直接渠道形成了鮮明對比,在這些渠道中,創始人和公司有一個直接的渠道來傳達他們的信息,并解釋他們正在做的事情。
Harry Stebbings:還有另一點,我覺得有點不公平,我對傳統媒體感到有點同情。我不在乎點擊量,因為我們有贊助商。坦率地説,即使沒有贊助商,我們也會繼續做這個節目。我不會做那些譁眾取寵的标題,我不會把節目搞得花裏胡哨,不會因為優化點擊量而做"Scale AI預測軍事災難"這樣的标題。
Alexandr Wang:完全同意。你做節目是真心想教育和解釋發生了什麼,而不是為了點擊量。
Harry Stebbings:這幾乎不公平。你能想象有人説:"嘿,我要做Scale AI,但我不在乎是否虧錢?"你會想,"哦,天哪,我怎麼跟這個競争?"
Alexandr Wang:是的,但我認為這很明顯。你知道,我在國會作證時得到了比過去幾年中從各種媒體那裏得到的更公平的對待。聽起來很荒謬,但我認為我們現在處于一種畸形狀态,許多傳統媒體因為這種以點擊量為導向的方式,而不是出于真正的教育目的,幾乎沒有辦法對公司保持完全公平。所以我認為公司有責任通過直接渠道、播客等方式,清晰地講述他們的故事,确保他們的信息不會被曲解。
Harry Stebbings:完全同意,這就是為什麼今天創始人品牌比以往任何時候都重要,因為如果你不掌握自己的傳播渠道,信息就會被扭曲。
Alexandr Wang:十分正确,我認為這是當今世界的一種令人震驚的狀态。
Harry Stebbings:這是否改變了你的策略?
Alexandr Wang:是的,我們現在會認真思考如何将直接信息傳達出去。正如你所説,我們會尋找最純粹的方式來傳達和解釋我們正在做的事情。這就是一個很好的例子。你會問我一個問題,我會按照我的想法回答,這個答案會傳達到你的聽眾和觀眾那裏。這是傳播信息最純粹的形式之一。
Harry Stebbings:人們犯的一個大錯誤是他們試圖為公司建立直接渠道,但説實話,人們不會關注Scale,他們關注的是Alex。建立個人追随者比建立公司追随者要容易得多。
Alexandr Wang:很少有公司能夠像OpenAI那樣,作為一個實體擁有很多品牌意義,但即便如此。
Harry Stebbings:看看Sam Altman的熱搜次數和OpenAI的熱搜次數之間的差距,Sam Altman的熱搜次數要高得多。人們現在比以往任何時候都更喜歡個人崇拜。
Alexandr Wang:這是一個很有趣的現象,這确實應該引起關注。
Harry Stebbings:這種現象超越了個人。看看Lionel Messi在邁阿密的表現,看看Margot Robbie在《芭比》中的表現,組織或運動中的個人名人推動了一切。
Alexandr Wang:這很有趣,這可能反映了人類内心深處對關聯的強烈需求。我認為我們作為人類,有很多能力來理解個人。我們有能力理解個人,但很難理解一個組織意味着什麼。沒有直觀的聯系。
Harry Stebbings:那麼創始人應該在意傳統的PR嗎?他們應該關心進入傳統媒體嗎?
Alexandr Wang:我認為我們處在一個他們不應該在意的時代,他們應該思考的是,有一個有趣的觀點,并且找到傳達這個觀點的最純粹的方式。
Harry Stebbings:你覺得媒體在什麼時候對你們進行了全面的攻擊?
Alexandr Wang:我會説,幾乎可以精确地説,我們經歷了一個不可思議的上升期,也許是在2019年我們最初成為獨角獸時,之後的幾年感覺一切順風順水。然而,從大約2022年開始,整個科技叙事或者説媒體叙事突然轉向了攻擊科技公司。你知道,在某種程度上這是公平的,因為許多科技公司獲得了非常高的估值,科技界充滿了令人難以置信的興奮情緒,随後市場崩潰了。從2022年開始,我注意到對我們的報道基調完全改變了,媒體開始專注于指出像我們這樣公司的失誤,或者我們的很多同行的失誤,而不是試圖保持平衡的視角。
另一個例子是大約從2020年開始,我們與美國軍方和國防部合作,這顯然是在當前的國防科技熱潮之前。長期以來我們作為公司有一個堅定的信念,即讓美國國防部獲得出色的AI技術對世界的未來非常重要。在随後的幾年裏,我會説,傳統媒體實際上批評我們支持美國政府和軍方,而不是從更廣闊的視角來看,認為這可能是一件積極的事情,支持美國軍方。就像我之前所説的,關于在國會作證和媒體對待的對比,我在國會作證時得到了相對公正的對待,他們意識到這是一項強大的技術,我們需要慎重對待,但他們認為美國在這方面領先非常重要,感謝你們所做的一切。而媒體則以一種極具諷刺的态度來看待,比如,"這是一件好事嗎?我們能信任這家公司嗎?這意味着什麼?"這種态度真的令人震驚。
Harry Stebbings:但我認為你們理解的是,動機驅動結果。媒體的動機是什麼?國會的動機是什麼?國會不是為了銷售或點擊,他們希望得出一個關于最佳結果的明智決定。正如你所説的,動機驅動結果。我還喜歡你説過的一句話,你説"找到真正關心的人比聽起來要難得多",你是什麼意思?你在招聘時如何看待這一點?
Alexandr Wang:當你真正簡化問題時,這聽起來很簡單,但如果你雇傭那些我們内部稱之為"真正關心"的人,他們真正關心自己的工作成果,真正關心工作質量,真正關心組織,他們關心确保公司產生影響,他們就是那種真的很在乎的人。這意味着他們願意關注每一個細節,如果他們遇到障礙或阻力,他們會花額外的精力去解決這些問題。這就是創業公司運作的基本方式——你有一群小團隊,每個人都比大公司裏的普通員工更關心10倍或100倍,因此你最終會比大公司解決更多的問題。
人才戰略執行
Alexandr Wang:我們大約有800人。
Harry Stebbings:你們現在已經達到較大公司的規模了。你知道,要做到只雇傭"A級"員工或者優秀員工變得更難了。按定義來説,優秀員工是稀有的,你能有800個優秀員工嗎?
Alexandr Wang:我認為答案是肯定的。我們在内部經常讨論的是如何雇傭海豹突擊隊,而不是海軍,這并不是説海軍有什麼問題,而是如何擁有一個真正精英的小團隊,真正從中挑選出最優秀的人才。這歸結于流程。對于我們公司來説,即使到了現在,我仍然會批準每一個新雇員。我會親自面試或查看面試反饋,并了解我們雇傭的每個人,以确保我們保持一個異常高的标準。
Harry Stebbings:那麼,有多少次你會反對團隊對新雇員的推薦?
Alexandr Wang:我會説,大約有25%到30%的時候會反對,挺多的。通常這是因為,也許是新的招聘經理需要調整,或者這是各種形式的邊緣案例。但對我來説,作為公司的創始人,我已經看過了所有進來的人,并且我看到了誰成功了,誰失敗了。我幾乎像一個算法一樣,基于我所見識到的成功者,發展出了理解哪些人在Scale能成功的數據集,哪些人像海豹突擊隊一樣優秀,哪些人只是普通的海軍。這是我作為創始人的職責,确保我們作為一個組織,能夠真正利用過去八年來在公司内部積累的所有知識和經驗,并将其延續下去。
Harry Stebbings:最後一個問題,你認為自己最大的管理或領導失誤是什麼?比如我的一個例子是,我發現人們的行為要麼出于恐懼,要麼出于自由。你帶進來的人,有些人是出于"你必須表現"的壓力行動,而其他人則是出于"我信任你,我尊重你,你盡力就好"的自由行事。你只需要識别某人屬于哪個陣營,然後希望如果他們有能力,他們應該能做到最好。我希望在開始時我就知道這一點,但我沒有,我只是對所有人都施加了壓力。你現在知道了什麼是你希望當初就知道的?你在哪些方面犯過錯?
Alexandr Wang:最大的一個錯誤其實是在2020到2021年間,認為公司的高速增長意味着你必須要快速擴大團隊。因此,在那幾年,我們和很多科技公司一樣,團隊人數每年翻倍甚至三倍。2020年時我們大約有150人,到2022年底我們已經超過700人,這是一種瘋狂的招聘速度。團隊的高速增長讓我發現,當你如此快速地招聘時,就不可能做到我們剛剛談論的那些事情,即保持高标準和團隊内部的卓越感。
Harry Stebbings:你在實時中看到這個标準的下降了嗎?
Alexandr Wang:這有點微妙。你會招聘很多新人,然後可能在接下來的一年或六個月後,你會逐漸注意到這個變化,發現組織中出現了一些過去能夠輕松解決的問題,但現在卻逐漸變得難以應對。你會注意到,從2022年底我們有700人,到現在我們有800人,團隊的規模基本保持不變。我認為我們真正考慮的是如何在公司收入大幅增長的情況下,保持團隊的穩定。
Harry Stebbings:這很有趣,公司有品牌的轉捩點。它們會變得炙手可熱,然後冷卻下來,再次變得熱門。你知道我的意思嗎?從外界來看,Scale現在似乎再次變得熱門了,你明白我的意思嗎?
Alexandr Wang:确實是這樣。
Harry Stebbings:我并不是想特别讨好或不讨好你,我不是在説你們遇冷,而是品牌确實會有熱門和冷清的時刻。
Alexandr Wang:這是一個非常有趣的現象。其實,我也曾問過Patrick Collison(Stripe的聯合創始人兼CEO)這個問題。顯然,Stripe是一家令人難以置信的公司,在很長一段時間裏,我認為它一直是硅谷标志性的公司之一。我問他是否認為他們是硅谷标志性公司這一事實對他們的招聘有利。他給出了一個有趣的觀點,希望我能分享這一點。他説,他們雇傭的最優秀的人,往往是那些無論Stripe是否是硅谷最熱門的公司都會加入的員工。那些偏離主流的員工反而是他們最好的雇員,而那些因為他們是硅谷最熱門的公司而加入的人,往往并不是最有價值的員工。普遍的信念和叙述是,你希望成為最熱門的公司,這樣你就可以吸引最優秀的人才,從而實現快速增長,并繼續保持增長。但這往往是非常困難的,更多的是如何建立一個自我維持的優秀人才生态系統,保持高标準,并始終尋找最優秀的人才,而不管公司是否熱門。因為正如你所説,你會有熱門的時刻,也會有冷淡的時刻,熱門與否都會有,所以你需要這個人才生态系統在不依賴這些的情況下,自我維持。
Harry Stebbings:為了吸引最優秀的人才,我也認為這取決于職能領網域。比如在很多市場開拓職能方面,傳統上銷售人員傾向于集中在更熱門的品牌。如果你能吸引一群出色的銷售人員,尤其是在擴展地理區網域時,這會帶來很大幫助。我想到的是OpenAI在倫敦的市場開拓團隊,他們非常出色,是倫敦最好的團隊之一,因為他們擁有一個了不起的品牌。你明白我的意思嗎?所以這取決于你離核心的距離以及你所處的職能領網域。
Alexandr Wang:是的,我認為你説得對。
Harry Stebbings:你看很多核心技術開發,大部分還是由最接近核心的人推動。
Alexandr Wang:不僅如此,這些人很多都是在OpenAI成為最熱門公司之前就已經在那裏工作的人。所以我認為這是另一家公司經歷過的現象,比如Airbnb,Brian Chesky(Airbnb的聯合創始人兼CEO)他公開談到過,在疫情之後,他突然意識到他必須重新構建整個公司。他大幅縮減了團隊規模,投入更多精力提高人才密度,并保持團隊的小規模。我認為現在他們是科技行業中每位員工的利潤率最高或之一的公司。這種認識讓他意識到,他不需要繼續擴大團隊規模就能實現财務收益,或者至少是财務產出。
互動問答
Harry Stebbings:我們來進行一輪快速問答吧。我會做一個簡短的陳述,然後請你立即分享你的想法。聽起來怎麼樣?在過去的12個月裏,你對什麼看法改變最大?
Alexandr Wang:我認為,實際上是關于我們之前讨論的所有這些高速增長的問題,尤其是将團隊的快速增長與公司的快速增長區分開來,并更多地投資于質量和卓越。
Harry Stebbings:你聽到的關于人工智能的最大誤解是什麼?
Alexandr Wang:我認為今天最大的誤解是,我們與AGI之間的唯一障礙就是計算能力,而實際上我們還需要數據的支持才能達到那裏。
Harry Stebbings:你已經有一個很棒的董事會了,但如果你可以從世界上任何非你目前的董事會成員中選擇,你會選擇誰作為下一個董事會成員?
Alexandr Wang:當然,這可能不太現實,但我确實認為Satya Nadella(微軟現任CEO)是現代最傑出的商業戰略家之一。他在微軟取得的成就相當驚人,我認為任何董事會擁有他都将非常幸運。
Harry Stebbings:我不應該問這個問題,但我還是想問,你覺得你應該被問到,但從未被問過的問題是什麼?
Alexandr Wang:一個有趣的問題是,我對人工智能的看法在不同階段是如何變化的。我之所以提到這個問題,是因為我在2016年創立了公司。公司的前三年完全專注于自動駕駛和自動駕駛汽車。然後我們開始研究人工智能。2019年,我們實際上開始研究生成式AI,并與OpenAI合作研究GPT。因此,我們是少數幾個見證了多個人工智能時代的公司之一,也經歷了自動駕駛汽車技術的第一個繁榮與衰退周期。這是一個有趣的問題,即在這些時代的成功之處有哪些相同之處,哪些是不同的。
Harry Stebbings:你的看法如何改變?你現在最興奮的是什麼?
Alexandr Wang:我非常興奮,但我也認為有理由保持謹慎。
Alexandr Wang:我認為在自動駕駛汽車熱潮中發生的一件事是,許多承諾與技術現實脱節。因此,許多知名的自動駕駛汽車公司,為了籌集資金,做出了越來越大膽的承諾。這些承諾一開始并沒有完全脱離現實,但随着時間的推移,它們變得越來越脱離技術現實。這導致了一個非常痛苦的谷底,因為承諾沒有兑現,所以感覺整個行業都在崩潰。
Alexandr Wang:實際上,到今天為止,我們現在看到Waymo在舊金山的街道上行駛。我們看到完全合格的L4級自動駕駛汽車在路上行駛。特斯拉的自動駕駛功能也變得非常好。所以如果我們在這個過程中做出的承諾更加慎重,我認為現在我們會對自動駕駛汽車感到非常滿意。然而,實際上我們經歷了一個巨大的高潮,一個巨大的谷底,現在可能又處于回升階段。我認為這是我對生成式AI的一個大擔憂,我希望不會發生,但同樣的事情可能再次發生。我們現在正在做出一些關于這項技術的非常大的承諾,這些承諾可能會與技術現實脱節,然後這将產生一個必然導致後遺症的差距。
Harry Stebbings:特朗普會赢嗎?倒數第二個問題。
Alexandr Wang:我仍然認為這其實是個五五開的問題。美國選舉是非常奇怪的事情,因為最終總是由搖擺州來決定。坦率地説,我不信任任何海岸地區的人(我是其中之一,我住在舊金山)能夠對搖擺州的局勢有細致的理解。所以我完全不知道。我認為任何住在海岸地區的人都不應該被聽取意見來判斷會發生什麼。我認為最終總是歸結到搖擺州。
Harry Stebbings:最後一個問題,朋友,十年後的Scale是什麼樣子?
Alexandr Wang:你知道,我希望我們做的事情和現在非常相似,那就是繼續成為人工智能的數據熔爐,并為人工智能的進步提供數據支柱。你知道,有件事情我經常思考。
Harry Stebbings:你想要上市嗎?
Alexandr Wang:當然,我确實經常思考的是,如何解決那些永不過時的問題。
Harry Stebbings:但是你想成為一家上市公司的CEO嗎?你懂我的意思嗎?我看着Stripe,他們做得很好,但如果我是Stripe,我不知道我是否願意。
Alexandr Wang:上市公司顯然有其明顯的優勢,但我認為Stripe是一家令人難以置信的公司,他們可以極其盈利。因此,他們可以實現所有的核心财務目标而不需要上市。
Harry Stebbings:聽着,Alex,我很高興你能上這個節目。非常感謝你加入我。Allie説的很好,面對面做這個節目真是太棒了。抱歉有那麼多曲折轉彎,但這次訪談非常精彩。
Alexandr Wang:是的,訪談很愉快。
原文:Alex Wang:Why Data Not Compute is the Bottleneck to Foundation Model Performance
https://www.youtube.com/watch?v=jNbEr9F0wiE
報名即送十月管理論壇名額一個!價值12800元!
開班時間