今天小編分享的科技經驗:黃仁勳談“主權AI”:基礎設施不能指望外包,歡迎閱讀。
本文來自微信公眾号:明亮公司,作者:MD,原文标題:《黃仁勳、Mistral CEO談「主權AI」:AI基礎設施,不能指望外包》,題圖來自:視覺中國
近日,知名VC A16Z的合夥人Anjney Midha與英偉達創始人兼CEO黃仁勳、Mistral聯合創始人兼CEO Arthur Mensch在其播客節目中讨論了主權人工智能、國家人工智能戰略,以及為什麼每個國家都必須掌控自己的數字智能等話題,其中着重讨論了當AI日漸成為新一代國家基礎設施的之際,國家如何部署AI、應對AI競争。
Mistral是一家法國的AI公司,創立于2023年,專注于開發開源大模型,Arthur Mensch此前曾就職于DeepMind。A16Z和英偉達均是Mistral的投資方,Mistral上一輪融資後估值約為62億美元。
在訪談中,兩位創始人也探讨了關于開源和閉源模型與安全之間的關系,二人均認為,國家限制輸出模型,并不能意味着就會變得更"安全",反而開源模型的飛輪效應能夠加速AI進程,從而使"閉關鎖國"背景下的模型面臨很高的被淘汰風險。
此外,二人還對AI通用性與專用性之間關系進行了讨論,他們均認同AI是一種通用技術,但同時也是一種專用型技術,在國家層面,需要更好地适應國情、文化和社會習慣等因素,因此,對于國家而言,"親自下場"參與尤為重要,不能指望外包"作為基礎設施的數字智能"。
以下為"明亮公司"結合AI編譯的對話内容:
AI将是國家的基礎設施
Anjney Midha:今天,我們來聊"主權AI",讓我們先從不同國家的領導者那裡得到的第一個問題開始——AI實際上是一種通用技術嗎?在人類歷史上,我們可能只有少數這樣的技術。一些經濟學家稱,這些技術加速了整個社會的經濟進步,例如電力、印刷機等等。現在每個人都在問的問題是,這是思考AI的正确方式嗎,還是AI只是另一種重要但最終只是垂直領網域的技術?
Arthur Mensch:它是一種通用技術,因為它從根本上改變了我們構建軟體和運用機器的方式。就像互聯網是一種通用技術一樣,AI也是一種通用技術。它允許構建代表你行事的Agent,在這方面,它可以用于任何行業的垂直領網域。它可以用于服務、公共服務,它可以改變民眾的生活,它可以用于農業,當然也可以用于國防目的,所以它涵蓋了國家需要關注的一切。因此,從這個角度來看,任何國家将其作為優先事項并制定專門的國家AI戰略是非常自然的。
黃仁勳:100%同意Arthur所說的。而且,這也是人們放棄的原因:如果它是一種通用技術,且一家公司可以構建最終的通用技術,那麼為什麼其他人不能做同樣的事情呢?但這也是一個思維把戲,讓人們相信這種技術只能由少數人去構建,而其他人只需坐享其成。
我建議每個人都參與AI,這不是特權階層的專屬。智能技術是為每個人服務的,不僅僅是世界上少數幾家公司應該去構建它。沒有人會比瑞典更關心瑞典文化、瑞典語言、瑞典人民和瑞典生态系統。沒有人會比沙特更關心沙特的生态系統。沒有人會比以色列更關心以色列……
技術是通用的,但智能技術也是高度專業化的,原因是這樣的:坦白說,我不認為我會等待一個通用聊天機器人成為某個特定疾病領網域的專家。我仍然認為,我寧願有一個在該領網域高度專業化的人員,去微調、訓練,使其專門化。
Arthur Mensch:AI是一種通用技術,就像編程語言一樣。它還是一種承載了文化的技術,這意味着,存在一種基礎設施,當然,不是每個國家都會打造芯片。像基礎模型、Web壓縮這樣的通用模型,最終會開源,可以作為構建專門系統的正确基礎。
但除此之外,我認為這取決于組織、企業、國家去構建他們的所需。讓其發揮作用的方法是,采用像開源模型這樣的通用模型,并将你所擁有的特定知識,或者讓你的公民、讓你的員工将他們的知識提煉到系統中,提煉到代表你行事的Agent中,從而使這Agent逐漸變得更準确,更符合國家或企業構建AI系統時的指令和規範。
因此,你需要垂直領網域的專家,你需要文化專家,你需要那些擁有特定國家議程的人,與技術公司合作,這些公司能夠以易于使用的方式,以易于專門化的方式,展示開源基礎設施。我認為,這就是前沿,它是一種非常水平化(horizontal)技術,但要使其發揮任何作用,你需要水平提供者與垂直領網域專家之間的合作。
與歷史上的其他通用技術浪潮不同,比如電力或印刷機,這一次有什麼不同呢?如果我是國家領導人,我應該如何思考我們國家的AI?我應該将其視為數字勞動力嗎,還是将其視為某種橋梁?
我認為,它與電力相似。從經濟角度來看,它将在未來幾年内對每個國家的GDP產生兩位數的影響。這意味着每個國家都需要關注它,因為如果他們不能在合适的地方建立基礎設施,建立屬于自身主權的能力,那麼這意味着可能會有資金流向其他國家。因此,這在一定程度上改變了全球的經濟平衡。
從這個意義上說,它與一百年前的電力并沒有太大不同。當時,建設電力工廠,你是在為從鄰居那裡購買做準備。當然,最終這很好,因為它創造了一些依賴關系。所以,我認為從這個意義上說,它是相似的。
有什麼不同呢?我認為有兩點。首先,它是一種有點模糊的技術。如果你想要用它來創造數字勞動力,你需要塑造它,你需要有基礎設施、人才和軟體,而人才需要在本地培養。我認為這很重要,原因在于,AI與電力不同,這是一種内容生成技術。因此,你有產生内容的Agent,它們生產文本、生產影像、生產語音,與人互動……而當你生產内容并與社會互動時,你就成為一種社會構建。
這一意義上,社會構建承載着文化,承載着企業或國家的價值觀。因此,如果你不希望這些價值觀消失,也不希望依賴于集中的供應商,你需要更深入地參與其中,而不是像對待電力那樣去參與。
Anjney Midha:你同意這個觀點嗎,Jensen?
黃仁勳:有幾種方法可以思考這個問題。一個方向是,國家的數字智能不太可能是想要外包給第三方的東西。
一些需要考慮的因素是,你的數字智能現在是你的一種新基礎設施,就像你的電信、醫療保健、教育、高速公路、電力一樣,而現在來到了新的一層,就是你的數字智能。你有責任決定這種數字智能如何發展,以及你是否希望将其外包,或者這是你想要參與的,甚至可能控制并塑造成為國家基礎設施的東西。
另一種思考方式是你的數字勞動力。現在這是新的一層,你必須決定這個國家或公司的數字勞動力,是你決定外包,希望它按照你所期望的方式發展,還是你想要參與,甚至決定控制、培養并使其變得更好。
我們總是雇傭通用型員工,我們從學校招聘他們,他們中有些人比其他人更通用,有些人比其他人更聰明。一旦他們成為我們的員工,我們決定讓他們入職。培訓他們,給他們設定護欄(guardrailing),評估他們,持續提升他們。我們投入必要的資源,将通用智能轉化為超級智能,從而讓我們受益。
在這兩種情況下,它都為國家經濟做出貢獻,它都為社會進步做出貢獻,在兩種情況下,它都為文化做出貢獻。我認為在這兩種情況下,國家都需要在其中發揮非常積極的作用。沒錯,它确實是一種通用技術,但你必須決定如何塑造它。
你們國家的數據是屬于你們的、你們的國家圖書館,你們的歷史,你們想要将其數字化,你們可以将其提供給全世界,你也可以提供給國内的公司、研究人員和機構,它屬于你們。當然,這些都是非常模糊的東西,它們是非常軟性的概念。但它确實屬于你們,你可以決定如何将其用于造福你的人民,它屬于你們,因為你有責任塑造它的未來主權,這是你們的責任。
Anjney Midha:除了軍事、電力網絡等國家資助和保護的資產外,如果沒有理解AI基礎設施和主權AI的關鍵性,是否需要控制整個技術棧?
Arthur Mensch :Jensen提到數字勞動力,我認為這是一個很好的類比,你需要為你的 "AI勞動力"提供就業的平台,這意味着你需要能夠定制模型,并将你國家圖書館中的知識注入到模型中,這樣它突然就能更好地使用你的語言。你需要能夠讓你的系統了解你的法律,以便當你部署AI軟體時,符合你所設定的邊界。
那個就業平台需要能夠定制、設定護欄(guardrailing)、評測,然後當注意到某些事情需要改進時,修復問題,調試問題。這就是我們正在構建的平台。一旦定制系統完成,能自己維護它們是很重要的。這意味着能夠在你自己的基礎設施上部署它們,能夠讓你的技術合作夥伴潛在地消失。
黃仁勳:你的IT部門将成為你的數字勞動力的HR部門,他們将使用Arthur描述的這些工具來入職AI、微調AI、設定護欄、持續評估它們并改進它們。那個飛輪将由現代版本的IT部門管理,我們将擁有生物勞動力和數字勞動力,這是非常棒的。所以沒有人會為你做這件事,你必須自己去做。
盡管我們有這麼多技術公司,每個公司仍然有自己的IT部門,我有自己的IT部門,我不會在未來将其外包給其他人。它們對我來說将變得更加重要,因為它們将幫助我們管理這些數字勞動力。你将在每個國家、每個公司中都這樣做,而這些國家中的每個公司都将這樣做。所以對于Arthur所描述的,要将這種通用技術微調後真正成為相關領網域專家,這是AI的巨大未來空間。
Anjney Midha:我想确認下你們兩人所說的,你提到文化,你說有一系列規範,你定制模型時訓練數據中就有這些規範(norms)。
黃仁勳:你說的是規範,這正是意味着它是軟性的,而不是規則,規則更硬,算法也是,算法和法律是非常具體的。
Arthur Mensch:是的,你想在系統中融入不同的東西。有一些風格和知識的元素,你不會通過嚴格的邊界設定來強制執行,而是可以通過持續訓練模型來實現。你采用國家圖書館的内容、采用偏好,并将其提煉到模型中。然後你有一套流程,如果你在公司裡,你有一套政策,這些是嚴格的,所以通常構建的方式是,你将模型連接到嚴格的規則上,并确保每次輸入時,都驗證規則是否得到遵守。所以,一方面是軟性的,偏好、文化。
黃仁勳:人的偏好是多維的,有太多特征定義了我的偏好,很難想象如果讓人類用Python來描述這些,比如用C++來描述"基于這個,我更喜歡這個,但如果那樣做,我更喜歡另一個東西"。如果人類真的那樣做,規則的數量将是難以想象的,這就是為什麼AI有能力将所有這些代碼化。它是一種能夠處理生活模糊性(ambiguity of life)的新編程模型。
Anjney Midha:你的意思是AI不僅僅是一種計算基礎設施,它也是一種文化基礎設施。
Arthur Mensch:它關乎确保你的文化基礎設施以及公司或國家中的人類專業知識能夠融入到AI系統中。
黃仁勳:文化會刷新價值觀。我們剛才還在讨論,這些AI模型、AI服務對提問的回應方式各不相同,對吧?因為它們已經将服務或公司的價值觀編程到各自的服務中了。你能想象它在國際層面上的規模效應嗎?
Arthur Mensch:這是集中式AI模型的一個内在局限性,你認為你可以将一些普遍價值觀和普遍專業知識寫入一個通用模型中。在某個時候,你需要将通用模型拿過來,問特定的員工群體或大眾群體,他們的偏好是什麼,他們的期望是什麼,你需要确保你以一種軟性方式和硬性方式來專門化這個模型,通過規則和文化偏好。所以這部分是不能外包的,無論是作為一個國家還是作為一個企業,你需要掌控它。
Anjney Midha:可能這麼說有點誇張——如果它是一種文化基礎設施,而我沒有它的主權,那麼所涉及的利害關系基本上相當于"現代數字殖民"。如果你說,你得把AI當作幾乎是你的數字勞動力,而另一個國家或不是我的主權國家的人可以決定我的數字勞動力能做什麼或不能做什麼,那這就是一個問題。
黃仁勳:有些東西是普遍的,例如,某些公司可以為全世界的國家和社會以及公司服務,因為它是基本通用的,但它不能是唯一的社會肌理,它不能是唯一的層級,它不能是唯一的數字智能層,它必須由某種地區性的内容來增強。
嘿,你知道,我認為麥當勞到處都很好,肯德基也到處都很好,星巴克也不錯。但你仍然希望有當地的風格、當地的口味來增強它。這就是文化,它定義了社會、定義了我們。所以我認為到處都有沃爾瑪是可以的,你可以依賴它。但你需要有當地的風格、當地的口味、當地的服務。
也許讓我換一種說法,很可能在未來,就我們的數字勞動力而言,我們會有一些通用的數字工人,它們擅長做一些基礎研究或類似的事情,對每家公司來說都不必要重新創造,對吧?我認為Excel很好,Microsoft Office是普遍優秀的,我很樂意使用它。
Anjney Midha:一個好用的參考架構。
黃仁勳:沒錯,然後還有行業特定的工具和行業特定的專業知識,這對我們來說很重要。……你的數字勞動力也會是這樣的,AI也會是這樣的。會有一些你可以直接從貨架上拿下來的東西,新的搜索很可能會有一些AI,但然後會有工業版本的AI,我們可能會從Cadence和其他公司那裡得到,然後我們不得不培養我們自己的,使用Arthur的工具,我們不得不微調它們,讓他們變得更好。
Arthur Mensch:我非常同意這種願景,即有一個通用模型,然後有一些行業層面的專門化,然後是公司和國家層面的更高一層專門化。你會有一個越來越專門化的AI系統樹。
也許可以舉一個具體的例子,就是我們最近在1月份發布的Mistral模型,它是一個通用模型,所以它會說所有的語言,它對大多數事情都有所了解。但随後,我們開始了一個新的專門化模型家族,這些模型在語言方面進行了專門化。所以我們加入了更多的阿拉伯語,更多的印度語言,并重新訓練了模型,我們将這些額外的知識提煉出來,這些知識是初始模型未曾見過的。通過這樣做,我們實際上讓它在說阿拉伯語和印度半島的語言時更加符合習慣用法。
而且,對于給定大小的模型,如果你選擇專門化它,你可以得到一個更好的模型。今天,我們的24B模型,經過阿拉伯語專門化後,表現超過了其他五倍大的語言模型,原因就在于我們進行了專門化。
這是第一層。然後,如果你考慮下一個更高層次,你可以考慮垂直領網域。所以,如果你想構建一個模型,它不僅擅長阿拉伯語,而且還能處理沙特阿拉伯的法律案件,例如。好吧,你需要再次專門化,所以還有一些額外的工作需要與公司合作完成,以确保你的系統不僅擅長說某種語言,而且還能理解在這種語言中進行的法律工作,所以對于任何語言和垂直領網域的組合,你都可以想象到,都需要進行專門化。
如果你想要一個會說法語的醫療診斷助手,好吧,你需要擅長法語,但你也需要理解如何用法語進行醫療診斷,對吧?所以這兩件事對于通用模型提供商來說是非常難做的。
Anjney Midha:如果你所描述的是對的,那麼我需要在我們的本地規範、我的本地數據上定制這個AI層,這從技術能力角度來看相當復雜。那麼,你會如何建議一個大國去思考這個技術棧呢?我們談論的是芯片、計算、數據中心、模型、應用,然後最終是你描述的AI護士或AI醫生。你會如何建議一個較小的國家與之不同地去思考呢?
Arthur Mensch:我會建議擁有這個技術棧的水平化(horizontal)部分,所以你需要基礎設施,你需要推理基元(inference primitives),你需要定制基元,你需要可識别性,你需要能夠将邊界連接到模型上,将模型連接到實時信息源等,這些基元在不同國家、不同企業都是工業化的,都能買得到。然後你可以根據你的價值觀、你的專業知識、你的本地人才,從這些基元開始構建。
問題是,什麼是水平化的?可以如果你是一個小企業或小國家,你應該購買什麼,而什麼又是僅适用于你的、需要你自己去構建的。
黃仁勳:你必須明白,這并不像你想象的那麼難。首先,因為技術正在變得更好,更易于使用。你能想象五年前做這件事嗎?那是不可能的。你能想象五年後做這件事嗎?它将變得微不足道。我們正處于中間階段。唯一的問題是,你是否需要去做這件事?如果你得出結論,這對你是重要的,那麼你就必須盡快參與其中,學習并一路學習,只要知道它正變得越來越容易。
事實上,我們嘗試去做Agent系統,三年前也是極其困難的,但Agent系統如今要容易得多。所有用于策劃數據集、入職數字員工、評估員工、設定護欄的工具,所有這些都在不斷改進。關于技術的另一點是,當它變得更快時,它就變得更容易了。
你知道,我有幸見證了計算機從最早的時期開始發展。計算機的性能曾經是如此令人沮喪地慢,你所做的一切都很困難。但如今,你知道,我們所做的事情是如此神奇,因為速度也很快。無論是出于你的機構需求,還是出于參與這項有史以來最重要的技術,事實是,它正在變得越來越好,所以借口越來越少。
Anjney Midha:因為變革是困難的。如果我是國家領導人,我面臨着不斷增加的地緣政治風險,我不知道我的盟友是誰,選舉即将到來,我有無數的事情需要處理。但現在,假設我理解了這一點,你花了很多時間與國家領導人交談,他們詢問關于快速部署AI的風險,你從他們那裡聽到的最常見的問題是什麼?
Arthur Mensch:我聽到過一些問題,但其中一個風險是看到你的民眾開始害怕這項技術,擔心它會取代他們。然而,如果我們可以共同努力,确保每個人都能接觸到這項技術并接受使用它的培訓,那麼這種恐懼是可以避免的。因此,對民眾的技能培養是極其重要的,要讓人們明白AI是一個機會,讓他們能夠更好地工作,并通過應用程式、通過他們可以在智能手機上安裝的東西、通過公共服務來展示其真正的目的。
例如,我們正在與法國的失業系統合作,通過AI Agent将就業機會與失業者聯系起來,這些Agent當然由機構内的人類操作員激活,這是一個非常容易被接受的機會,讓人們更好地找到工作。因此,這是确保民眾理解機會的一部分,AI真的只是他們需要采用的一種新變化,就像他們在90年代采用個人電腦,以及在2000年代采用互聯網一樣。
這些變化的共同點是,你需要讓人們接受這項技術。我認為國家可能面臨的最大問題是,AI可能會增加已經相對較大的數字鴻溝。但如果我們共同努力,并以正确的方式去做,我們可以确保AI實際上正在縮小數字鴻溝。
黃仁勳:AI是一種新的編程計算機的方式,因為它通過輸入一些文字,你可以讓計算機做某事。就像我們過去所做的那樣,我們輸入文字,讓計算機做某事。現在你可以與它對話,你可以通過多種方式與它互動,你可以讓計算機為你做事,這比以前容易得多。今天能夠使用ChatGPT編程計算機的人數遠遠超過能夠使用C++編程計算機的人數。因此,從人類潛力的角度來看,我們已經縮小了技術差距,這可能是迄今為止我們所見過最偉大的技術平權因素。
Arthur Mensch:但你仍然需要讓民眾了解它。
黃仁勳:我只是在描述一個事實。事實是,使用ChatGPT編程計算機的人數比使用C++編程計算機的人數要多。實際上,在過去的三年裡,這是一個不争的事實。
……
開源:更加安全還是更高風險?
Anjney Midha:讓我們來談談開源的熱潮,因為你們兩人都公開談論過在主權背景下開源模型的重要性。去年,Nvidia和Mistral共同訓練了一個名為Mistral NeMo的模型。為什麼開源模型是你們如此重要的一部分?為什麼開源模型是你們如此重要的一部分?
Arthur Mensch:首先,這是一種水平化的(horizontal)技術,企業和國家最終願意在自己的基礎設施上部署它。從主權的角度來看,擁有這種開放性是很重要的。第二點是,發布開源模型很重要,因為它可以加速進程。我們創建Mistral的基礎是,我們在2010年至2020年之間進行AI研究時看到,由于每個實驗室都在相互構建,進程加速了,而這種加速在第一個大型語言模型出現後,尤其是OpenAI的模型之後,就消失了。
因此,重新啟動這種開放的飛輪——我貢獻一些東西,然後另一個實驗室貢獻其他東西,然後在此基礎上進行迭代——這就是我們創建Mistral的原因,我認為我們在這方面做得很好,因為我們開始發布模型,然後Meta也開始發布模型,然後中國公司如DeepSeek發布了更強大的模型,每個人都能從中受益。
回到NeMo,關于創建AI模型的開放方式的一個困難是,這更像是一個大教堂而不是集市,當涉及到開源時,因為構建一個模型需要大量的投入。因此,我們與Nvidia團隊所做的就是真正将兩個團隊結合起來,讓他們在相同的基礎設施上工作,使用相同的代碼,解決相同的問題,并結合他們的專業知識來構建同一個模型。這非常成功,因為Nvidia帶來了我們不知道的東西,而我們帶來了Nvidia不知道的東西,最終我們生產出了當時同尺寸下最好的模型。
因此,我們真的相信這種合作,并且認為我們應該在更大規模上進行更多合作,不僅僅是兩家公司,而是可能三家或四家公司,這就是開源将如何占上風。
黃仁勳:是的,我完全同意。開源的好處,除了加速并提升所有通用模型和通用能力的基礎科學外,開源版本還激活了大量的利基市場和利基創新。突然之間,在醫療保健、生命科學、物理科學、機器人技術、交通等領網域,由于開源能力足夠好而被激活的行業數量是驚人的。
Anjney Midha:但在任務關鍵型領網域,數據可能很敏感。
黃仁勳:是的,例如,在能源開采領網域,誰會去創建一個AI公司來開采能源呢?能源開采本身是一個非常重要的領網域,但能源開采的市場規模并不大,因此開源激活了每一個這樣的領網域,金融服務也是如此,你可以随意挑選。
Arthur Mensch:任何"任務關鍵型"的領網域,都需要做自有部署,可能還需要在邊緣進行部署,對任何需要進行強審計并能夠進行徹底評估的領網域,如果你能夠訪問權重,你就可以更好地評估一個模型,而不是僅僅通過API訪問。因此,如果你想要圍繞你的系統建立100%的準确性,我認為你不應該使用閉源(模型)。
黃仁勳:而且你必須将其融入到你的循環中。如何将你的本地數據連接起來?将它與你自己的本地數據、你自己的本地經驗連接起來。使用得越多,它就變得越好。那個飛輪,你無法在沒有開源的情況下做到這一點。
Anjney Midha:假設我是一個國家領導人,我正在考慮開源,我開始聽到有人說:"嘿,開源是對國家安全的威脅。我們不應該出口我們的模型,因為這些開源模型實際上洩露了太多信息。更重要的是,壞人也可以使用這些開源模型,因此這對安全構成威脅。相反,我們應該做的是關上大門,只允許兩三個獲得政府許可的擁有基礎設施的實驗室獲來進行訓練。"我确實聽到很多這樣的說法。我應該如何思考這個問題?這與你告訴我的相反,即開源對于任務關鍵型行業更好?
Arthur Mensch:實驗室之間的合作對于人類的成功至關重要。如果一個國家決定封鎖一切,唯一會發生的事情是另一個國家将占據領導地位。切斷自己與"開源飛輪"的聯系,對于保持競争力的代價實在太高了。
在美國有這樣的争論,如果一個國家對模型權重(weights)進行出口管制,這并不會阻止歐洲或亞洲的任何國家繼續取得進展,他們甚至将合作以加速這一進程。因此,我認為我們需要接受這樣一個事實——這是一種水平化(horizontal)技術,非常類似于編程語言,編程語言都是開源的,對吧?我認為AI也需要開源。
黃仁勳:控制軟體是不可能的。如果你試圖控制它,那麼其他人會說:"好吧,讓我們自己來。"就像Arthur提到的那樣。問題是,開源更安全嗎?開源提供了更多的透明度,更多的研究人員,更多人的檢查。這就是為什麼世界上每一個雲服務提供商都是基于開源構建的。
給我一個例子,一個公共雲今天是基于非開源的基礎設施堆棧構建的。你從開源開始,你可以對其進行定制。但開源的好處是,有這麼多人的貢獻。而且,開源的檢查是非常重要的。你不能在開源中随意放置任何東西。如果你這樣做,你會在網上被人嘲笑。你必須在開源中放置好的東西,因為審查是如此嚴格。因此,我認為開源提供了所有這些好處:促進合作、加速創新、提升卓越、确保透明度、更多檢查——所有這些都提高了安全性。
Anjney Midha:從某種意義上說,你們認為,部分原因是開源更安全,就像我們看到的開源數據庫、存儲和網絡計算一樣。全世界都可以幫助你進行紅隊測試(red teaming),而不是只有公司内部的一小群研究人員。
黃仁勳:是的,沒錯。
Arthur Mensch:通過将許多組織聚集在一起,共同開發一種技術,使他們都可以使用并針對自己的領網域進行專門化,你實際上是在強迫技術對每個人都變得更好。因此,這意味着你正在消除偏見,你正在确保你構建的通用模型盡可能好,不會出現故障。我認為從這個意義上說,開源也是一種減少故障點的方法。
如果你今天是一家公司,決定完全依賴單一組織及其安全原則和紅隊測試組織,你可能有點過于信任它了。而如果你基于開源模型構建我的技術,你實際上是信任世界,确保你所構建的基礎是可靠的。所以,這減少了故障點,這顯然是一個企業和國家都需要做的事情。
打造公司:什麼是好的組織結構?
Anjney Midha:我們現在要稍微轉換一下話題,談談公司建設,這是很多人非常期待從你們兩位那裡聽到的内容。那麼,讓我們先從你開始,Jensen。你提到Nvidia是世界上最小的大公司。是什麼讓你們能夠以這種方式運作?
黃仁勳:我們的架構是為了适應快速變化的世界而設計的,這種變化可能是由我們自己引起的,也可能是影響我們的外部因素。原因在于,技術變化非常快。如果你過度強調可控性,那麼你就會削弱系統适應變化的能力,無法保持敏捷。因此,我們的公司文化強調"對齊"(aligned),而不是"控制"(control)。我很少使用"控制"這個詞來描述公司的運作方式。我們注重最小化官僚主義,讓流程盡可能輕量化,以提高效率和敏捷性。
是在平靜的鄉村,還是更接近于水泥森林?你處于什麼樣的環境中?因為你要構建的系統類型應該與你所處的環境保持一致。讓我感到奇怪的是,每家公司的組織架構看起來都很相似,但它們做的事情卻各不相同。一家公司可能像蛇一樣靈活,另一家可能像大象一樣龐大,還有一家可能像獵豹一樣敏捷。盡管它們在森林中都扮演着不同的角色,但它們的組織架構卻驚人地相似,這似乎并不合理。
Arthur Mensch:我同意,公司确實有各自特點。盡管它們的組織架構有時看起來相似,但我們還有很多東西要學習。我們的公司還不到兩年歷史,所以對我們來說,最大的挑戰之一是,Mistral是一家深科技公司,它是由科學驅動的。科學并沒有軟體行業那樣的時間尺度,你不能按月來規劃。有時候,你并不清楚事情什麼時候會準備好,但與此同時,客戶卻在詢問下一個模型何時推出,某種能力何時可用。
因此,我們需要管理好客戶的期望,我認為這是我們正在做的一件好事。我們需要在產品需求和科學研究之間找到平衡。你不想讓研究團隊完全專注于讓產品工作,你需要讓他們保持一定的獨立性。
我認為我們在這方面做得很好,我們開始在公司内部實現不同頻率的運作——在項目方面,我們每周進行迭代;而在科學研究方面,我們則更注重深入探索,研究產品在某些領網域為何表現不佳,以及如何通過研究、新數據、新架構或新方法來改進它。這種模式在典型的SaaS公司中是不存在的,因為這本質上是一個科學問題。
Anjney Midha:Nvidia是一家在過去30多年裡非常成功的公司,它已經找到了讓科學和研究始終領先于世界的一些方法,無論是2012年的CUDA,還是今天的Cosmos,後者在模拟領網域無疑是最先進的。那麼,這種模式是否正确呢?
黃仁勳:我們在公司内部協調了Arthur剛才所說的。我們有基礎研究、應用研究,然後是架構設計,最後是產品開發。我們有多個層面,這些層面都是必不可少的。是的,它們都有自己的時間節奏。在基礎研究方面,頻率可能相當低,但另一方面,在產品方面,我們有一個龐大的行業客戶群體,他們依賴我們。
因此,我們必須非常精确。一方面,我們管理基礎研究,希望發現那些沒有人預料到的驚喜;另一方面,我們又要能夠滿足大家的預期,可預測地交付產品。我們在公司内部協調了這兩個極端。
Anjney Midha:這個市場中有許多令人困惑的事情,但其中有一件我想特别指出:客戶同時也是你的競争對手。Nvidia向AWS出售GPU,而AWS正在開發自己的芯片,名為Trainium。Arthur,你們訓練的模型通過AWS和Azure銷售,而這些雲服務提供商資助了像Anthropic和OpenAI這樣的實驗室。在這種環境下,你們如何取得勝利?你們如何管理這些關系?因為我們之前談到了公司内部的建設,但現在我很好奇,你們如何在這種外部環境中生存?
Arthur Mensch:Jensen說得很對,你要放棄控制,但要努力保持一致。盡管有時候某些公司可能是競争對手,但你們可能有共同的利益,可以在特定的議程上合作。
黃仁勳:你必須有自己的位置。顯然,這些雲服務提供商與Arthur合作,并不是因為他們已經有了相同的東西,而是因為他們希望擁有兩樣類似的東西。這是因為Arthur和Mistral在世界上擁有獨特的地位,它們在特定領網域提供了獨特的價值。我們今天讨論的許多内容都是Mistral和Nvidia在世界上獨特擅長的領網域。我們與眾不同。
你知道,我們不僅僅是一個ASIC(專用集成電路)制造商。我們能夠為雲服務提供商(CSPs)做很多事情,這些是他們自己無法做到的。例如,我們的架構被廣泛應用。在很多方面,我們是未來初創公司的第一個切入點,原因在于,通過與Nvidia合作,他們不需要在戰略或商業上綁定任何主要的雲服務商。他們可以對接每一家雲服務提供商,甚至可以決定自己建立系統,因為最終,經濟因素可能會對他們更有利,或者他們可能希望獲得我們提供的一些在雲服務提供商内部受到保護的能力。
無論出于何種原因,為了成為一個好的合作夥伴,你仍然需要有一個獨特的地位,你需要有一個獨特的價值主張。我認為Mistral有一個非常獨特的價值主張,我們也有一個非常獨特的價值主張。我們在世界上的位置很重要,即使是我們與之競争的人。
當我們在舒适區内時,當我們對自己的身份感到自在時,我們就能成為所有雲服務提供商的優秀合作夥伴。然後,我們希望看到他們成功。我知道這聽起來有點奇怪,當我們把他們視為競争對手時,但我們并不把他們視為競争對手,我們把他們視為合作夥伴,他們碰巧也與我們競争。你知道,我們為雲服務提供商所做的最重要的事情之一就是為他們帶來生意,而一個偉大的計算平台就是能帶來生意。
Anjney Midha:我記得當我第一次和Arthur見面時,我們在倫敦的一家餐廳裡,深夜還在讨論他的A輪融資計劃,當時我們正在讨論他為什麼需要這麼多資金。現在回想起來,Mistral的A輪融資籌集了5億美元,而其他一些公司為了達到同樣的階段卻花費了數十億美元。
當時我問他:"你們想用什麼芯片來運行?"他看着我,好像我問了一個荒謬的問題一樣,仿佛答案不言而喻——除了Nvidia的H100芯片,還能用什麼?Nvidia投資于初創企業和創始人的生态系統,甚至在沒有人知道他們之前就投資了。是什麼思想在引導你如此深入地投資于初創企業和創始人,甚至在他們成名之前?
黃仁勳:我想原因有兩個。首先,我很少稱我們所制造的產品為GPU。雖然我們制造的是GPU,但我認為Nvidia是一家計算公司。如果你是一家計算公司,最重要的事情是開發者。我們的所有策略、行動、優先事項、聚焦點和投資,100%都與"開發者至上"的理念保持一致,這也可以被稱作生态系統。
所以,一切都從這裡開始,也在這裡結束。我們舉辦開發者大會,公司内部的所有舉措都是以開發者為中心的。這是第一點。
第二點是,我們當時正在開拓一種全新的計算方法,這種方法對于通用計算世界來說是非常陌生的。這種加速計算方法在很長一段時間裡都是非常陌生的、反直覺的,甚至有些笨拙。因此,我們一直在尋找下一個令人驚嘆的突破,下一個看似不可能實現的事情,而這些如果沒有加速計算是無法做到的。
所以,很自然地,我會去尋找像Arthur這樣的研究人員和偉大的思想家,因為我在尋找下一個殺手級應用。如果還有某個令人驚嘆的計算機科學思想家我們還沒有接觸過,那肯定是我的疏忽,我們一定要去接觸他們。
Anjney Midha:從計算的角度來看,你認為未來有哪些最重要的趨勢?特别是對于那些可能正在領導世界上增長最快的市場的政府決策者們,他們試圖了解計算的未來發展方向,你會如何指導他們?
Arthur Mensch:我們正在朝着越來越異步的工作負載發展,也就是說,你将一個任務交給AI系統,然後它會花20分鍾進行研究,然後再返回結果。這肯定會在一定程度上改變你看待基礎設施的方式,因為這會帶來更多的負載。所以,這對我們來說是一個看好的案例,無論是對數據中心還是對Nvidia來說都是如此。正如我開始時所說,如果你沒有正确的AI Agent入職基礎設施,所有這些都不會發生,如果你沒有一種流行的方式讓AI系統了解它們所互動的人,以及如何向它們提供信息。
從與人類互動中學習的方面在未來幾年将變得極其重要。還有一個方面是關于個性化的,即讓模型和系統整合對用戶的最佳表示,以盡可能有用的方式為他人服務。我認為我們還處于這個階段的早期,但這種情況将深刻改變我們與機器的互動方式,這些機器将更多地了解我們的品味,了解如何為我們提供盡可能有用的服務。
我想作為總理或國家領導人,我想考慮教育,确保我有一個了解AI的本地人才庫,能夠創建專門的AI系統。我還需要考慮基礎設施,既包括實體方面,也包括軟體方面。所以,什麼是正确的基礎組件?與誰合作才能為你提供入(數字勞動)就職平台?這兩點很重要。如果你擁有人才,并且與這群人深度合作,你的國家經濟将發生深刻的變化。
黃仁勳:在過去的十年裡,我們看到了計算領網域的巨大變化,從手工編碼到機器學習,從CPU到GPU,從軟體到AI。整個技術棧、整個行業都經歷了徹底的變革,而我們仍在經歷這一變革。在接下來的十年裡,情況将更加令人難以置信。當然,我們知道預訓練很重要,而且将繼續如此。但現在我們有了後訓練,後訓練包括思想實驗、實踐、輔導、指導以及我們人類用來學習的所有技能。
你知道,思考和Agent系統、信息性數字工作者AI即将出現的想法真的很令人興奮。這對計算的意義非常深刻,這也是我們在過去……人們對我們推出Blackwall感到驚訝,原因是我們為推理構建了Blackwall,而且恰逢其時,因為思考本身是一個巨大的計算負載。
所以,有一個計算層面,還有我們将看到的AI類型。有Agent AI、信息性數字工作者AI,但還有物理AI正在取得巨大進展,以及物理AI也在取得巨大進展。物理AI當然是那些遵循并理解物理定律、原子定律、化學定律等所有自然科學的AI。
你知道,所有這些自然科學領網域我們都将看到一些重大突破,這将影響工業、科學、高等教育和研究。然後還有物理AI,這些AI理解物理世界的本質,從摩擦力到慣性,因果關系,以及物體的永久性等常識性的東西,人類有常識,但大多數AI卻沒有。我認為這将使許多機器人系統成為可能,這将在制造業等領網域產生重大影響。
美國經濟非常依賴知識工作者,而許多其他國家則非常依賴制造業。因此,我認為許多國家領導人應該意識到,他們需要的能夠變革和革新其行業的那些AI即将到來,他們應該保持高度警惕。
我鼓勵人們不要過分敬畏技術,有時候當你過分敬畏技術時,你最終不會去參與它,你會害怕它。不要害怕。我們今天讨論的關于AI的一些内容,比如它如何縮小技術差距,這确實是一個非常重要的國家利益,你有責任去參與它。無論如何,未來令人興奮。