今天小編分享的教育經驗:英偉達黃仁勳對話歐洲最大AI獨角獸Mistral CEO: 開源是技術民主化的基石;AI将對每個國家的GDP產生雙位數影響,歡迎閱讀。
作者| a16z
來源 | Z Potentials 管理智慧AI+
咨詢合作| 13699120588
文章僅代表作者本人觀點
圖片來源:a16z
AI是一種通用技術,它允許構建代表你行事的Agents,它可以應用于任何垂直行業。它可以用于服務業、公共服務、改變公民的生活,也可以用于農業、用于國防用途。因此,它涵蓋了國家需要關注的所有領網域。
但這種觀點也是一種心理陷阱,試圖讓人們相信智能這種技術是少數人才能構建的產物,其他人只需坐等其成。我的建議是,每個國家都應積極投入AI建設。這不是屬于全球少數科技公司的特權,更是全人類的共同事業。盡管AI本身是通用技術,但沒有人會比瑞典更關心瑞典文化、瑞典語、瑞典人民和瑞典生态系統,沒有人會比沙特阿拉伯更關注沙特生态,同樣,以色列的國家利益也唯有以色列人最重視。
這揭示了集中式AI 模型的内在局限性,即試圖将普世價值觀與通用知識編碼進一個通用模型中。事實上,在特定場景下,必須基于特定員工或公民群體的偏好與需求,對通用模型進行定制化改造。
開源是技術民主化的基石。對于企業和國家而言,最終都希望在自己的基礎設施上部署模型,而開放性從主權視角來看至關重要,這是第一點。第二點重要性在于,開源模型的發布能加速技術進步。
我想鼓勵人們不要對技術過度敬畏。有時候,過度崇拜或過度敬畏某項技術,反而會讓你不敢真正投入其中,甚至產生某種畏懼心理。
全球AI算力龍頭NVIDIA的創始人兼CEO Jensen Huang和生成式AI獨角獸公司Mistral的聯合創始人兼CEO Arthur Mensch,兩位AI領網域的專家,共同讨論主權AI、國家AI戰略、開源協作等話題,本文為此次訪談實錄。
主權AI的戰略價值與國家主導權:文化承載與數字主權之争
Host: 今天我們要讨論的是主權AI、國家基礎設施以及開源的話題。讓我們先從各國領導人最常問的問題開始,AI是否真的是一種通用技術?在人類歷史上,我們可能只經歷過少數幾種被經濟學家稱為"通用技術"的領網域,這些技術能廣泛加速整個社會的經濟進步,例如電力和印刷術。現在所有人都在問的問題是,AI是否應該以同樣的方式看待?或者說,為什麼AI不能僅僅是另一種重要但本質上局限的技術?
Arthur Mensch: AI是一種通用技術,因為它從根本上徹底改變了我們構建軟體和使用機器的方式。就像互聯網是一種通用連接技術一樣,AI在此處是一種通用技術。它允許構建代表你行事的Agents,從這一點來看,它可以應用于任何垂直行業。它可以用于服務業、公共服務,可以改變公民的生活,可以用于農業,當然也可以用于國防用途。因此,它涵蓋了國家需要關注的所有領網域。正因如此,任何國家都應将其視為優先事項,并制定專門的國家AI戰略。
Jensen Huang: Arthur說的所有内容100%正确。但問題恰恰出在這裡,如果AI是通用技術,而某一家公司可以打造出終極通用技術,那為什麼其他人還需要做這件事呢?這正是其邏輯漏洞所在。但這種觀點也是一種心理陷阱,試圖讓人們相信智能這種技術是少數人才能構建的產物,其他人只需坐等其成。我的建議是,每個國家都應積極投入AI建設。這不是屬于全球少數科技公司的特權,更是全人類的共同事業。沒有人會比瑞典更關心瑞典文化、瑞典語、瑞典人民和瑞典生态系統,沒有人會比沙特阿拉伯更關注沙特生态,同樣,以色列的國家利益也唯有以色列人最重視,盡管AI本身是通用技術。我完全同意"智能怎麼可能不具備通用性"的觀點,但它同樣需要高度專業化。坦率地說,我并不期待一個通用的聊天機器人能在某一特定疾病領網域成為專家。我仍然更傾向于讓那些在該領網域高度專業化的人來進行微調、訓練以及後期訓練。一個AI模型應該在該領網域實現專業化。
Arthur Mensch: AI作為一種通用技術,其性質類似于編程語言,它具備普适性,但同時也承載着文化屬性。這意味着,雖然存在一些基礎性的基礎設施(如芯片,并非每個國家都會自建)和通用模型(如基于網絡數據壓縮訓練的基礎模型),這些最終可能開源,為構建專用系統提供基礎。除此之外,機構、企業和國家需要根據自己的需求進行定制化開發。有效的方式是采用一個通用模型,例如開源模型,将特定領網域的知識提煉到系統中,如公民或員工的專業經驗,融入代表你行事的Agents。通過這種漸進過程,這些Agents會越來越精準地遵循國家或企業在構建AI系統時設定的指令和規範。你需要垂直領網域的專家、文化專家或具有特定國家議程的人員,與能夠提供易用、易定制化開源基礎設施的科技公司合作。關鍵在于,AI是一種橫向技術,要使其真正發揮作用,需要橫向技術提供商與垂直領網域專家的深度協作。
Host: 但與歷史上之前的通用技術浪潮(如電力或印刷機)不同,這次有何不同?如果我是一個國家的領導人,試圖理解在我的國家中關于AI的正确思考框架是什麼,我應該将其視為數字勞動力嗎?還是應該再次将其視為橋梁?
Arthur Mensch: AI與電力類似,它将在未來幾年對每個國家的GDP產生雙位數的影響。從經濟角度來看,每個國家都需要重視這一點,因為如果它們未能建立基礎設施、未能在本土打造主權AI能力,就意味着這些經濟利益可能會流向其他國家。這正在改變全球的經濟平衡。從這個意義上說,這與電力并沒有太大不同。100年前,如果你不建造發電廠,就意味着你準備從鄰國購買電力,這最終會導致依賴性,而這并不是好事。從這個角度來看,AI與電力是相似的。
但有什麼不同之處?我認為有兩點。首先,它是一種可塑性技術。如果你想用它創建數字勞動力,你需要塑造它。其次,你需要擁有基礎設施、人才和軟體,而這些人才需要在本土培養,我認為這一點非常重要。原因在于,與電力不同,這是一種内容生成技術。你擁有能夠生成内容(如文本、影像、語音)并與人類互動的Agents。當生成内容并與社會互動時,你就成為了社會建構的一部分。從這一點來看,社會建構承載着企業或國家的文化和價值觀。如果你希望這些價值觀不會消失且不依賴中心化提供商,就需要比參與電力建設更深入地參與其中。
Host: Jensen,你同意這一點嗎?
Jensen Huang: 可以從幾個角度來思考這個問題。你的國家數字智能不太可能是你未經考慮就外包給第三方的存在。數字智能如今是你的一項新基礎設施,如同電信、醫療、教育、高速公路和電力,現在又新增一層,這新的一層就是你的數字智能。你有責任決定希望它如何發展,是選擇完全外包從而永遠不必操心智能問題,還是将其視為需要深度參與甚至掌控的國家基礎設施,當然,這涉及Arthur提到的AI工廠、基礎設施等要素。另一種視角是将其視為你的數字勞動力。這同樣是一個新維度,你需要決定國家或企業的數字勞動力是否外包并寄望其按預期發展,還是主動參與塑造、培育和優化。就像我們始終在雇傭通用型員工,他們來自校園,有些更具通用性,有些更聰慧。但一旦成為員工,我們會對其進行入職培訓、技能培養、設定防護措施、持續評估與提升。我們投入必要資源,将通用智能轉化為可獲益的超智能。
我認為第二層思考應将其視為數字工作流。當然,基礎設施與勞動力這兩種視角都對國家經濟、社會進步和文化傳承有貢獻。在這兩種情況下,國家都需要發揮非常積極的作用。回到你最初關于主權AI的問題,如何思考它?它絕對是通用技術,但你必須決定如何塑造它。你國家的數字數據屬于你,就像國家圖書館的藏書和歷史檔案,只要你想數字化它,你可以向全球開放,也可以僅對本國的公司、研究機構和公民開放。這些數據本質上屬于你,因為它們是文化根基的載體。它們屬于你,因為你決定如何利用它們造福人民。它們屬于你,因為你有責任塑造它們的未來,這就是主權AI的要義,這是你的責任。
Host: 國家還資助和保護其他幾種類型的資產。比如軍隊、電力網絡等。如果說我已經理解了AI基礎設施和主權AI的重要性,那麼我現在是否需要掌控整個技術棧的每一個環節?
Arthur Mensch: Jensen提到了數字勞動力,我認為這是一個很好的類比。你需要一個針對AI員工的入職平台,這意味着你需要能夠定制模型,将國家圖書館中沉澱的知識注入模型,使其能更好地使用你們的語言。你需要讓系統理解本國的法律法規,從而确保部署AI軟體時設定的防護欄,能與你過往制定的所有規範保持合規。我們正在構建的平台正是這種支持定制、評估,并在發現問題時進行修復、調試的入職平台。更重要的是,當定制系統完成後,必須能自主維護它們。這意味着要能在自有基礎設施上部署,甚至能讓技術合作夥伴逐步退出系統閉環。
Jensen Huang: IT部門将變成你數字員工的人力資源部門。他們将使用Arthur提到的工具來為AI員工辦理入職、對AI系統進行微調、設定護欄、評估系統表現,并持續優化改進。這種自我強化的飛輪效應将由現代化更新後的IT部門來管理。未來人類員工将與數字員工協同工作,這種組合非常具有想象力。但關鍵在于這件事必須自主完成。正如當今世界雖有許多科技公司,但每家企業仍需要自己的IT部門,我們公司也有自己的IT團隊,絕不會進行外包,未來這些部門将更加重要,因為他們要協助管理數字員工。這種模式将在每個國家、每個企業落地。正如Arthur所描述的,通過通用AI技術打造高度定制化的領網域專家系統,無論是國家級AI專家、工業級AI專家,還是企業專屬AI專家,這些功能型AI專家系統将構成未來AI發展的廣闊藍海。
Host: 我想确認自己是否正确理解了兩位的觀點。你們提到的是一種軟性概念,類似于文化,即訓練數據中蘊含的規範,并基于這些規範對模型進行定制。這似乎意味着,與計算、存儲、網絡等硬體基礎設施不同,這類定制涉及的是抽象的文化層。
Jensen Huang: 你提到規範,這本質上是指一種軟性約束,與更剛性的規則形成對比,而算法和法律則屬于非常具體的範疇。
Arthur Mensch: 是的,在構建AI系統時,我們需要融入兩種要素。一方面,某些風格化特征與知識儲備并不适合通過剛性護欄強制實現,而是要通過持續的模型訓練來塑造。比如,例如,将國家圖書館資源、文化偏好等提煉并融入模型自身。另一方面,企業内部的流程和政策必須是剛性的規則。通常的做法是将模型與這些硬性規則相連接,并确保每次調用時都能驗證規則合規性。這本質上是兩個層面的結合,一邊是以柔性方式将知識灌注并壓縮進模型,形成文化偏好層面的軟性表達;另一邊則是确保策略與規則被100%嚴格執行的剛性框架。所以在第一個層面,這是軟性的,這是偏好,這是文化。
Jensen Huang: 偏好是多維度的,涉及海量特征參數。正如Arthur所描述的,只有AI才能精準捕捉并實現這種復雜偏好。試想若由人類用Python或C++編寫規則,逐條定義諸如"基于A條件我傾向X,基于B條件則傾向Y",其規則數量将呈指數級膨脹。這正是AI的獨特價值,它通過全新的編程模型,能夠系統化整合這些模糊性,将現實世界的復雜性編碼為可執行的邏輯。
AI不僅僅是計算基礎設施,它也是文化基礎設施
Arthur Mensch: 是的,正是如此。這是關于确保你公司或國家中的文化基礎設施和人類專業知識能夠融入到AI系統中。
Jensen Huang: 文化将反映價值觀。我們剛剛讨論到,每一個AI模型、AI服務都會根據被提問的問題類型給出不同回應,因為它們将自身服務或公司的價值觀編碼到了每一項服務中。你能想象這種現象在國際範圍内被放大後的情形嗎?
Arthur Mensch: 對我來說,這揭示了集中式AI模型的内在局限性,即試圖将普世價值觀與通用知識編碼進一個通用模型中。事實上,在特定場景下,必須基于特定員工或公民群體的偏好與需求,對通用模型進行定制化改造。這意味着要通過規則與文化偏好的雙重路徑,以軟性和硬性的方式對模型進行專業化調整。這一過程既不能由國家外包,也不能由企業外包,而是必須自主掌控。
Host: 那麼,如果說AI是文化基礎設施,而我卻不擁有其主權,這是否意味着現代數字殖民的風險已經迫在眉睫?如果AI被視為數字勞動力,而另一個國家或非主權實體能夠決定我的勞動力能做什麼、不能做什麼,這顯然是一個嚴重的問題。
Jensen Huang: 部分AI服務具有普适性。例如,某些公司能夠為全球各國、社會和企業提供服務,因為這些服務本質上是通用的。然而,它不能成為唯一的社會結構,也不能是唯一的數字智能層,它必須與區網域化特色相結合。就像麥當勞在全球各地都很受歡迎,肯德基和星巴克也是如此。但你仍然需要本地風格、本地味道作為補充,比如本地咖啡館、家庭餐館。因為這些定義了文化,定義了社會,定義了我們。我認為沃爾瑪遍布全球、值得信賴是件好事,但這并不意味着它應該取代一切。你仍然需要本地口味、本地風格、本地偏好、本地卓越以及本地服務。
也許讓我換個角度來說,在未來數字勞動力的情景下,很可能會出現一些通用的數字員工,他們可能非常擅長執行基礎研究或其他基礎性任務,或者它們對每家公司都有用。我認為沒有必要重新創造一些東西,Excel非常好,Microsoft Office在全球範圍内都非常出色,我對它們非常滿意。此外,行業專用工具和行業專業知識也至關重要。例如,我們使用Synopsys和Cadence。而Arthur不需要,因為這些工具專屬于我們的行業,而非他的領網域。我們可能都用Excel,都用PDF,都用浏覽器,這些都是通用工具,我們可以共同受益。同樣,也會有一些通用數字員工供我們使用。除此之外,還有行業專用AI和公司專用AI。
在我們公司内部,有一些對我們至關重要的特殊技能,它們定義了我們的獨特性,甚至可以說是高度定制化的。這些技能高度專注于我們需要的任務,設定了嚴格的護欄,以完成非常具體的工作,完全契合我們公司的需求與專長,從而使我們在這些領網域變得超乎尋常。你的數字勞動力和AI也将遵循同樣的模式,有些是現成的,比如新的搜索工具可能是某種AI,新的研究工具也可能是某種AI,同時,也會有工業版AI,可能來自Cadence或其他供應商。而更進一步的,我們必須使用Arthur的工具來培養自己的AI,進行微調,使其達到卓越水平。
Arthur Mensch: 我非常同意這種願景,即擁有一個通用模型,然後在行業層面進行一些專業化分層,接着在公司和國家層面進行更深層次的專業化,你将擁有一棵越來越專業化的AI系統樹。舉個例子,我們最近發布了一個名為Mistral Small的模型,它是一個通用模型,能夠處理多種語言,并掌握廣泛的知識。随後,我們基于它開發了一個專注于語言的專門化模型系列。我們增加了阿拉伯語和印度語等更多語言數據,并重新訓練了模型,從而提煉出初始模型未曾接觸的外部知識。通過這種方式,我們顯著提升了模型在使用阿拉伯語和印度半島語言時的地道表達。
語言可能是定制化模型的第一個切入點。關鍵在于,對于特定規模的模型,如果選擇在某種語言上專門化,你可以獲得性能更優的模型。例如,我們目前推出的24B模型,名為Mistral Saba,經過阿拉伯語調優後,其表現超越了規模是其五倍的其他大語言模型。這正是專門化的效果。這是第一層定制。接下來,你可以考慮垂直領網域的定制。例如,如果你希望構建一個不僅擅長阿拉伯語,還能處理沙特阿拉伯法律案件的模型,就需要進一步的專門化。這意味着需要與相關公司合作,确保系統不僅能流利使用某種語言,還能理解該語言中的法律工作。這種邏輯适用于任何垂直領網域與語言的組合。比如,你想要一個法語醫療診斷助手,它不僅要精通法語,還要掌握醫生使用的專業法語。這些定制化工作,對于通用模型提供商來說是很難完成的。
Host: 如果這一觀點成立,且你所描述的需求真實存在,即我需要能夠基于本地規範和復雜本地數據定制AI層的能力,從技術能力的角度來看,你會如何建議一個大國思考我們正在談論的技術棧,包括芯片、計算資源、數據中心、上層的模型、應用程式,以及最終你提到的AI護士或AI醫生等應用?同時,你會如何為一個小國提供不同的建議?
Arthur Mensch: 我的建議是,你需要購買并搭建技術棧中的橫向部分。你需要基礎設施、推理原語、定制化原語、可觀測性,以及将防護欄連接到模型、将模型與實時信息源連接的能力。這些原語在不同國家和企業之間具有較高的通用性。一旦具備這些可以采購的基礎, 你就可以開始工作,開始構建。你可以從這些原因出發,根據自身價值觀、專業知識以及本地人才進行開發。問題的關鍵在于,如何界定橫向通用部分與垂直特定部分的邊界。如果是一個小型企業或小國,可能應該購買橫向通用部分,而垂直特定部分則必須自主構建。
Jensen Huang: 你得明白,這件事沒有你想象的那麼難。首先,因為技術正在變得更好、更容易。你能想象五年前做這件事嗎?根本不可能。你能想象五年後做這件事嗎?那會變得輕而易舉。所以我們現在處于中間階段。唯一的問題是,你是否必須做這件事。事實是,我讨厭員工入職,因為這需要大量工作。但一旦你建立了HR組織、領導力導師組織和流程,那麼你入職員工的能力就會變得更容易,并且對每個參與者來說都更系統化、更愉快。起步總是困難的,這次也不例外。唯一的問題是,你是否需要做這件事。如果你想成為未來的一部分,而這是有史以來最具影響力的技術,不僅僅是我們的時代,而是有史以來最重要的數字智能。它還能有多大的價值?還能有多大的重要性?所以如果你得出結論,這對你很重要,那麼你必須投入其中。盡早學習,邊做邊學,并且要知道,它正變得越來越容易。事實上,即使在三年前嘗試構建Agentic系統也非常困難,但今天已經容易多了。所有用于管理數據集、入職數字員工、評估員工、為所有數字員工設定防護欄的工具都在不斷改進。
另一個關鍵點是,技術速度的提升讓一切變得更簡單。你能想象早期的計算機嗎?我有幸從計算機誕生之初就目睹它的發展,那時性能慢得令人抓狂,做任何事都困難重重。但如今我們做的事情簡直像魔法,而且速度極快。無論你是被"參與人類史上最重要技術"的使命感驅動,還是單純因為技術本身在不斷進步,這件事其實沒那麼難。我認為,推脫的借口已經快用完了。
AI普及克服數字鴻溝:真正的技術"平衡器"
Host: 讓我們花點時間讨論一下這個問題,畢竟變革總是艱難的。如果我是一個國家領導人,我面對的地緣政治風險不斷增加,盟友關系難以捉摸,選舉周期迫近,還有一大堆待辦事項。但現在我意識到AI的重要性。你們經常與各國領導人交流,他們最擔憂的是"采用AI過快的風險"。确實,巴黎人工智能峰會之後時代精神發生了變化,人們的基調比一年前的悲觀更偏向樂觀。但當這些國家領導人詢問風險以及如何思考這些風險時,你們最常聽到的問題是什麼?
Arthur Mensch: 我聽到幾個常見問題,其中一個風險是民眾因擔心被AI取代而產生恐懼。這種風險其實可以通過确保全民接觸AI技術并接受使用培訓來預防。如果我們共同努力确保每個人都能接觸到這項技術并接受使用它的培訓,這種情況實際上是可以預防的。因此,普及到各個公民群體是極其重要的。将AI展示為一種讓他們更好地工作的機會,并通過應用程式、通過他們可以在智能手機上安裝的東西、通過公共服務來展示其目的。例如,我們正與法國失業救濟機構合作,通過由人類操作員監管的AI Agents,将職位機會精準匹配給失業者。這種應用讓民眾直觀感受到AI如何幫助他們更好地找工作,從而更容易接受技術變革。本質上,AI與90年代個人電腦、21世紀初互聯網的普及類似,都需要人們主動擁抱技術。國家面臨的最大風險可能是AI加劇現有的數字鴻溝。但若共同努力,以正确方式推進,AI反而能成為縮小鴻溝的工具。
Jensen Huang: AI是一種編程計算機的新方式。過去我們通過輸入代碼讓計算機執行任務,現在你可以通過輸入文字或對話讓計算機完成任務。如今的互動方式更加多樣化,讓計算機為你做事變得比以往更容易。能夠通過提示ChatGPT完成高效任務的人數,僅從人類潛力的角度來看,遠超過過去能編寫C++代碼的人數。我們很可能已經縮小了技術鴻溝。
Host: 我們見過的最大的平衡器。
Jensen Huang: 從定義上講,它是有史以來最偉大的技術平衡器。
Arthur Mensch: 但你仍然需要讓公民了解它。
Jensen Huang: 我只是在陳述事實。如今用ChatGPT編程的人已經超過用C++編程的人數,這是不争的事實。AI已成為人類歷史上最強大的技術鴻溝縮小器。正如Arthur所說,外界可能存在各種讨論,但現實是這股浪潮不可阻擋。當下ChatGPT的活躍用戶數量驚人,我認為這非常棒。那些還在空談其他事情的人顯然沒有真正投入其中。人們已經意識到AI的驚人能力以及它如何助力工作。我每天都在用,今天早上還在用。Arthur和全球計算機科學家們的深度研究成果令人驚嘆,而用戶數量的激增證明人們正在積極擁抱這項技術。
開源協作:技術民主化與生态創新的雙赢路徑
Host: 讓我們來聊聊開源吧,因為你們兩位都公開強調過開源模型在主權層面的重要性。比如你在DeepMind時期參與制定的Chinchilla Scaling laws,這些研究成果是你的聯合創始人Guilam Llama公開的。去年,NVIDIA和Mistral合作訓練了一個名為Mistral NeMo的模型。為什麼開源模型成為你們關注的重點?
Arthur Mensch: 因為開源是技術民主化的基石。對于企業和國家而言,最終都希望在自己的基礎設施上部署模型,而開放性從主權視角來看至關重要,這是第一點。第二點重要性在于,開源模型的發布能加速技術進步。我們創立Mistral的初衷,源自2010至2020年間AI發展的觀察,當時各實驗室通過互相借鑑成果推動技術躍進,但這種開放協作的飛輪在OpenAI發布首個大語言模型後逐漸消失。我們致力于重啟這種開放生态,我們貢獻某項成果,其他實驗室在此基礎上貢獻其他創新,通過迭代推動整體進步。這也是我們創建Mistral的原因,我認為我們做得不錯,因為我們開始發布模型後,Meta等公司也加入開源行列,中國的DeepSeek等企業也推出了更強模型,整個生态因此受益。
回到Mistral NeMo項目,開源模式下構建AI模型的一個難點在于,它更像"大教堂"而非"集市"模式,因為構建模型需要巨額投入。我們與NVIDIA團隊的合作本質上是将兩種模式結合,讓雙方團隊在相同的基礎設施、代碼庫上協作,共同解決問題并融合專業知識來構建同一模型。這種合作非常成功,因為NVIDIA帶來了我們未知的洞見,我們也貢獻了他們未曾掌握的技能,最終產出了當時同規模中最優的模型。我們堅信這種協作的價值,認為應該擴大合作規模,不僅限于兩家公司,而是擴展到三到四家。這才是開源真正蓬勃發展的路徑。
Jensen Huang: 我完全同意。開源的好處,除了加速并提升基礎科學和通用模型、通用能力的發展,還在于它激活了大量利基市場和細分領網域創新。突然之間,在醫療、生命科學、物理科學、機器人、交通等領網域,因開源能力足夠強大而被激活的行業數量令人驚嘆。千萬别忽視開源的驚人潛力,尤其是在邊緣領網域和利基市場。
Host: 數據可能涉及敏感信息的準入關鍵點。
Jensen Huang: 沒錯,比如采礦能源領網域。誰會專門成立一家AI公司去開發礦業應用?能源确實重要,但能源開采本身的市場規模并不大。而開源能激活所有這些細分領網域,從金融服務到其他行業,你可以挑自己感興趣的領網域。
Arthur Mensch: 任何涉及關鍵任務、需要自主部署的場景,包括可能需要邊緣部署的場景,以及任何需要嚴格審計并具備全面評估能力的領網域,如果你能訪問模型權重而非僅依賴API,就能更徹底地評估模型。若你追求系統100%準确的确定性,就不應使用跨源模型。
Jensen Huang: 你必須将其連接到你的飛輪中。你将如何連接你的本地數據?如何将其連接到你的本地數據、本地經驗中?你用得越多,它就會變得越好。沒有開源,你無法做到這一點。
Host: 但假設我是一個國家領導人,我一直在考慮開源。我聽到一些聲音,比如開源對國家安全構成威脅。我們不應該出口我們的模型,因為這些開放模型實際上會洩露大量國家機密,或者更重要的是,壞人也可以使用這些開放模型。因此,這對安全構成威脅。相反,我們應該做的是将開發限制在兩三個實驗室之間,這些實驗室擁有基礎設施,可以從政府獲得許可進行訓練,進行正确的安全性和認證。我确實聽到很多這樣的說法。那麼我該如何權衡這種觀點與你們告訴我的觀點(即開放模式對關鍵任務行業更有利)之間的關系呢?
Arthur Mensch: 實驗室之間的協作對人類成功至關重要。如果一個國家選擇封閉技術,唯一的結果就是另一個國家将取得領導地位,因為脫離開放的協同發展機制會極大削弱你的競争力。這種做法并非沒有先例,美國就曾有過這樣的辯論。事實上,即便對模型權重實施出口管制,這既無法阻止歐洲各國,也攔不住亞洲國家繼續推進技術發展。它們會通過協作加速發展,我認為我們必須接受一個現實,即AI如同編程語言般屬于橫向基礎技術,而所有編程語言都是開源的,所以AI也應當開源。上周舉辦的AI峰會上,這種開放共建技術以加速共同進步的認知已被列入重要議程,這令人欣慰。顯然,開源技術仍有廣闊的發展前景。
Jensen Huang: 這是不可能控制的。正如Arthur所言,軟體根本無法被壟斷,若你試圖封鎖,其他人就會創造出新的标準并成為主導。關鍵在于,開源是否更安全?開源帶來了更高的透明度,讓更多研究者和開發者能夠審查技術成果。全球所有企業、所有雲服務提供商都基于開源技術搭建服務,正是因為開源是目前最安全的技術範式。試問今天哪家主流公共雲服務的基礎設施棧不是建立在開源之上?你可以基于開源進行定制,但開源的核心優勢在于匯聚眾人之力,更重要的是嚴格的代碼審查。開源社區不容許随意提交低質内容,只有經過嚴格審核的優秀成果才能被接納。這種協作機制加速創新、提升技術高度、确保透明度、吸引監督力量,所有這一切都在增強安全性。
Host: 換句話說,你是指開源技術(如數據庫、存儲、網絡、計算)通過大規模紅隊測試提升了安全性,因為全球開發者都能參與攻防測試,這相當于全世界的技術力量都能幫你進行紅隊測試,而不僅僅是公司内部的一小群研究人員?
Jensen Huang: 是的,完全正确。
Arthur Mensch: 通過匯聚眾多組織的力量共同開發技術,各參與方可在自身領網域進行專業化定制,你實際上在迫使這項技術必須滿足所有參與方的需求。這意味着你正在消除偏見,确保構建的通用中文模型盡可能完善且避免系統性缺陷。從這個角度看,開源也是減少技術故障的一種方式。如果作為一家公司,我決定完全依賴一個組織及其安全原則,以及其紅隊組織,這本質上是一種過度信任。而如果我在開源模型的基礎上構建我的技術,依賴的是全球開發者共同确保技術基底的可靠性。這種去中心化的信任機制顯著降低了單點故障風險,無論是企業還是國家,你都需要這樣做。
企業生存法則:靈活架構與生态共建
Host: 現在我們要稍微轉換一下話題,聊聊公司建設,很多人對你們兩位這方面的見解都很感興趣。Jensen,先請你談談。你曾說過NVIDIA是世界上最小的"大公司",是什麼讓你們能夠以這種方式運作?
Jensen Huang: 我們的架構設計有幾個核心考量。它被設計成能在一個充滿變化的世界中靈活适應,無論這些變化是我們主動引發的,還是外界環境施加的,背後的原因是技術迭代極快。如果你過度強調"可控性",就會削弱系統敏捷應變的能力。我們公司會用"對齊"這樣的詞,而避免使用"控制"這種表述。回想起來,我幾乎從未用"控制"這個詞描述過公司運作方式。我們追求最小化官僚主義,盡可能讓流程保持輕量化。所有這些設計原則,最終都是為了提升效率、增強敏捷性等關鍵目标。
我們盡量避免使用諸如"部門"這種表述,當NVIDIA剛起步時,談論部門劃分是種流行做法。但我厭惡"分割"這個概念,為什麼要創建本質上彼此分割的組織?我同樣排斥"業務單元"這種說法,因為憑什麼要讓任何部分孤立存在?為什麼不盡可能整合公司資源?我希望構建一個更像計算單元般運作的系統,像計算機那樣以最高效的方式輸出成果。我們的組織架構看起來有點像計算堆棧。關鍵在于,我們要打造什麼樣的機制?我們希望在怎樣的環境中生存?是類似寧靜的鄉村,還是混凝土叢林般的殘酷環境?所處環境決定了你應該構建與之匹配的系統類型。最讓我感到奇怪的是,每個公司的組織結構圖看起來都差不多,但它們實際運作方式卻完全不同,有的是蛇,有的是大象,有的是獵豹。在這個商業叢林中,每個企業本應具備獨特形态,但現實中它們的架構和層級設定卻完全雷同,這種同質化現象實在難以理解。
Arthur Mensch: 我認同公司确實有各自的"特性"。雖然組織架構有時看似相似,但顯然我們還有很多需要學習的地方,畢竟公司成立還不到兩年。我們現在存在着挑戰,但我認為競争對手們也面臨同樣挑戰,作為首批真正由科學驅動的深度科技軟體公司,我們的研發周期與傳統軟體公司截然不同。你需要按月推進,但有時無法精确預判技術突破的時間點。而客戶卻在不斷追問"下一個模型何時發布"、"某功能何時上線"等具體問題,這就需要高超的預期管理。對我們而言,最大的挑戰在于協調產品需求與科研能力之間的鉸鏈關系,這需要讓科研團隊不完全陷入產品實現的泥潭。目前我們正在建立多頻協同機制,在項目端保持每周迭代的高頻節奏,而在科研端則保持低頻深度思考,系統分析產品在特定領網域的表現根源,通過新數據、新架構、新算法等科研手段尋求突破。這種雙頻共振的運營模式具有開創性,在傳統科研機構中難覓蹤迹,因為這本質上是個科學探索與商業落地的融合命題。
Host: NVIDIA是少數能在30年發展歷程中持續保持科學與研究領先地位的成功企業,無論是2012年奠定基礎的CUDA系統研究,還是如今被視為行業标杆的Cosmos模拟技術,這套系統重新定義了數字仿真應該如何運作。
Jensen Huang: 我們和Arthur剛才所說的内容一樣。
Host: 這是啟發式的嗎?
Jensen Huang: 沒錯。我們在内部實現了這種動态平衡,基礎研究、應用研究、架構探索、產品開發等多個層級都是必不可少的,環環相扣。每個層級都有獨立的時間節奏,基礎研究的迭代周期可能長達數年,而產品開發端卻有成千上萬的客戶依賴我們的精準交付。關鍵在于,我們既要保留探索未知的科研自由,而那些可能帶來驚喜的突破往往源于此,又要在商業化層面兌現承諾。這兩個看似矛盾的維度,我們在運營中實現了和諧統一。
Host: 這個市場有太多有意思的地方,但有一點特别想指出來。你們兩個都有客戶同時也是你們的競争對手。這些競争對手都是規模龐大、資金雄厚的科技巨頭。NVIDIA把GPU賣給AWS,而AWS正在開發自己的芯片Tranium。Arthur,你通過AWS和Azure出售的訓練模型,而這些公司又資助了Anthropic和OpenAI這樣的實驗室。所以你們如何在這樣的環境中勝出?又該如何管理這些關系?之前我們讨論過公司内部建設,但現在我好奇的是,在外部這樣的情況下,你們要怎麼生存下來?
Arthur Mensch: Jensen說得很對,你放棄控制權,但要在對齊上下功夫。盡管有時候某些公司可能成為競争對手,但你們會有共同的利益線,可以在雙方一致的具體議程上展開合作。
Jensen Huang: 你必須有自己的立足點。但顯然,這些雲服務提供商和Arthur合作并非因為它們已經有了同樣的東西或者因為它們只是想要兩個同類產品,而是因為Arthur和Mistral在世界上有獨特的定位,在特定領網域創造了獨有的價值。今天我們讨論的許多領網域,比如Mistral的工作及其全球定位,正是它們特别擅長的方向。我們與他們不同,我們不只是另一個ASIC,我們能為雲服務提供商做它們自己無法完成的事情,也能與雲服務提供商共同完成一些任務。例如,NVIDIA的架構存在于所有雲端,并在許多層面發揮作用。我們是未來優秀初創公司的第一接入點,原因在于,通過接入NVIDIA,這些公司無需在戰略或業務層面對某家大型雲服務商做出承諾。它們可以進入所有雲端,甚至在未來經濟更有利時選擇自建系統,或者獲取那些在雲端受到一定保護的能力。
無論出于什麼原因,要成為優秀的合作夥伴,你必須擁有獨特定位和獨特價值主張,我認為我們具備這一點。甚至對與我們競争的人而言,我們的全球地位都至關重要。當我們對此感到自在、對自己有清晰認知時,我們就能成為所有雲服務提供商的優質合作夥伴,并真心希望它們成功。雖然聽起來有些奇怪,畢竟你視它們為競争對手,但關鍵在于,我們并不将其視為競争者,而是"恰好也會與我們競争的協作者"。我們為所有雲服務提供商做的最重要的事,就是為它們帶來業務。這正是優秀計算平台的價值,我們為人們創造商業機會。
Host: 我還記得第一次和Arthur見面時,我們坐在倫敦的深宵夜廳裡勾畫他的A輪融資計劃。當時我們試圖理解為什麼這輪融資需要這麼多資金,現在回頭看,這筆資金使用效率驚人。Mistral的A輪融資規模是5億美元,而其他公司需要花費數十億美元才能達到相同高度。當我問他,你希望在什麼芯片上運行模型時,你當時的眼神仿佛在說,這問題除了NVIDIA H100還能有什麼答案?而你們投資的初創企業生态确實為雲服務商創造了巨大價值。究竟是什麼哲學驅動着你們在所有人都不了解這些初創企業時,就如此深度投資創始人和早期項目?
Jensen Huang: 有兩個原因。第一,我很少稱我們為GPU公司。雖然我們生產GPU,但我認為NVIDIA本質上是一家計算公司。作為計算公司,最核心的關注點永遠是開發者,若只是芯片公司,關注焦點就僅限于芯片。我們所有的戰略、行動、優先級、聚焦點以及投資,百分百都以開發者優先的态度為準則。這等同于說計算平台優先,換個詞就是生态系統優先。一切都從這裡開始,也在這裡結束。GTC本質上是開發者大會(ZP注:3月17日至21日在美國加州聖何塞舉行的 GTC AI大會),公司内部所有舉措都以開發者為核心。這是首要原則。
第二,我們當時正在開創一種新的計算方法,這種方法在通用計算的世界裡非常陌生。這種加速計算方式曾顯得格格不入且反直覺,甚至長期被視為笨拙路徑。我們持續尋找那些必須通過加速計算才能實現的下一個突破性應用,那些非加速不可的難題。主動發掘像Arthur這樣的研究者和偉大思考者,對我來說是順理成章的,因為我需要找到下一個殺手級應用。這本質上屬于創新者的本能。如果還有未被我們合作的頂尖計算機科學思想家,那就是我的失職,必須立刻補救。
未來挑戰:社會重構與技術敬畏的平衡
Host: 從計算視角來看,你認為未來最重要的趨勢是什麼?特别是,如果面對一群可能是國家領袖,例如首相、總統、信息技術部長,或身處全球快速增長市場的決策者,他們試圖了解計算的未來方向,你會如何指導他們?
Arthur Mensch: 我們正朝着越來越異步化的工作負載方向發展。也就是說,你将任務交給AI系統後,可能需要等待它進行長達20分鍾的研究才能得到結果。這種模式正在改變你對基礎設施的考量,因為它會產生更大的負載。所以這對數據中心和NVIDIA來說是個利好組合。就像我在本期開頭說的,如果缺乏為Agents設計的适配基礎設施,如果AI系統沒有正确途徑去理解并學習與其互動的人類,這一切都不可能實現。未來幾年,從人類互動中學習的能力将變得至關重要。另一個關鍵點是個性化,通過模型和系統整合用戶畫像,使其效用最大化。我認為我們正處于這個領網域的早期階段,它将深刻改變人機互動方式,未來機器會更了解我們的偏好,并知道如何為不同人提供最精準的服務。
最後我想補充一點,作為一國首相或領導者,你必須重視教育,确保本土人才儲備具備足夠AI知識去開發專用AI系統。同時,還需要考慮基礎設施,包括物理層面和軟體層面。那麼究竟需要哪些正确的基礎架構?哪些合作夥伴能為你提供高效的Agent接入平台?這兩個維度至關重要。如果同時擁有這些資源、人才和深度合作夥伴關系,你所在地區的經濟結構将發生根本性變革。
Jensen Huang: 在過去的十年裡,我們見證了計算的巨大變革,從手工編碼到機器學習,從CPU到GPU,從軟體到AI。我們跨越了整個技術棧。整個行業已經完全改變,我們仍在經歷這一過程。未來的十年将會是令人難以置信的。當然,整個行業長期聚焦在擴展定律和預訓練的重要性上,這當然重要且将持續重要。但現在我們進入了訓練後階段,這涉及思維實驗、實踐、輔導、訓練等人類學習所需的全套技能。具有思考能力的Agentic系統和機器人系統即将成為現實,這确實令人振奮。這對計算的意義極其深遠,也是我們近期投入的重點。人們驚訝于Blackwell架構相比Hopper實現了巨大飛躍,原因在于我們專門為推理優化設計了Blackwell架構,并且時機精準,因為突然間,"思考"成為了巨大的計算負載。所以這裡存在一個基礎的計算層。
下一層是我們将要看到的AI類型。除了現有的Agentic AI和信息型數字工作者AI,物理學AI正在取得重大突破,這類AI能夠遵循并理解物理定律、原子規律、化學法則等科學原理,我對此非常期待,它将推動工業、科學、高等教育和研究領網域的變革。然後,理解物理世界本質的物理AI,從摩擦到慣性,因果和物體恒常性,這些人類有常識的基本事物,而多數AI目前尚不具備這些認知。這有望催生大量具備深遠意義的機器人系統,尤其是在制造業等領網域。美國經濟高度依賴知識型員工,而許多其他國家則以制造業為核心。對于各國首相和領導人而言,必須意識到AI即将對其核心產業,帶來颠覆性變革,無論是能源還是制造業,這種轉型已近在眼前,需保持高度警覺。
我想鼓勵人們不要對技術過度敬畏。有時候,過度崇拜或過度敬畏某項技術,反而會讓你不敢真正投入其中,甚至產生某種畏懼心理。正如我們今天讨論的,關于"AI縮小技術鴻溝"的觀點需要被正視,這涉及至關重要的國家利益,你有責任積極參與其中。無論如何,未來充滿激動人心的可能。
Host: 那真是太棒了。非常感謝你們兩位抽出時間。
原視頻:Jensen Huang & Arthur Mensch: Why Every Nation Needs Its Own AI Strategy
https://m.youtube.com/watch?v=Ww9SkW0Em58&t=2445s&pp=2AGNE5ACAQ%3D%3D
編譯:Hedy Liu