今天小編分享的科技經驗:美國AI務虛,中國AI務實?我對這個觀點不敢苟同,歡迎閱讀。
文 / 觀察者網專欄作者 餘鵬鲲】
自從 ChatGPT 面世以來,大部分 AI 相關新聞的熱點版面都被美國企業和它們的技術突破霸占了。通過世界各國媒體的介紹,美國企業的 " 文生文 " 以及 " 文生視頻 " 的 AI 模型已然是家喻戶曉。農歷新年之後,美國 AI 的熱度依然居高不下。
2 月 12 日,英偉達 CEO 黃仁勳在迪拜舉行的世界政府峰會中呼籲世界各國構建自己的主權 AI 基礎設施。在與阿聯酋人工智能大臣奧馬爾 · 奧拉馬的公開談話中,黃仁勳認為:每個國家都需要擁有自己的 AI 基礎設施,以便在保護自己文化的同時利用其經濟潛力。
迪拜作為本屆世界政府峰會的主辦方,認為 " 塑造未來政府 " 的主題與人工智能息息相關。而目前世界上大部分的 AI 算力,都是由英偉達的顯卡提供的,黃仁勳雖然不是國家和非政府組織的領導人,也受邀參加了此次峰會。
當地時間 2 月 15 日,舊金山的科技企業 OpenAI 發布了 " 文生視頻 " 模型 Sora。通過 Sora 生成的視頻不僅真實感強,而且支持多視角,時間成本也有所減少。這樣的效果極大地震撼了對 AI 所知不多的普通人,甚至讓一些人產生了工作即将被 AI 代替的焦慮。
Sora 生成的視頻中的一幀(圖自 OpenAI 官網)
與百花齊放的 AI 模型相比,AI 硬體基本上是英偉達一家獨大,AI 的編程模型也十分依賴英偉達的 CUDA 作為應用程式的開發接口(API)。因此,很多 AI 應用的開發者十分期待出現一個能與英偉達分庭抗禮的 AI 硬體廠商。
英偉達構建的顯卡計算生态
近期,多家媒體報道了一家名為 Groq 的加州 AI 企業。據稱該企業研發的加大語言處理單元(LPU)芯片,在與英偉達 H100 顯卡同樣進行生成式 AI 推理時,推理速度快了 10 倍,消耗電能卻只有 1/10。
經過筆者的查證,其實該公司在去年 11 月底就發布了這一成果。重新引發關注的原因,可能是該公司宣稱 LPU 的提出受到了中國正在研發的 " 神威 · 海洋之光 " 超級計算機的啟發。
不過當時就有媒體指出:AI 領網域的初創公司 " 都聲稱性能比英偉達好 10 倍 "。曾任阿裡技術副總裁的賈揚清算了一筆賬,Groq 的 LPU 在大部分情況下的擁有成本和采購成本,還是明顯高于 H100 顯卡。
因此目前看來,英偉達和 CUDA 生态是難以撼動的。這一點也體現在英偉達的财報上。
2 月 22 日,英偉達發布了 2024 财年第四季度及全年财務業績,全年淨利潤增長近 6 倍。除了利潤增長高得吓人,2024 财年的毛利率也達到了 72.7%,充分體現了高科技行業的高收益。
英偉達财務摘要
受 " 完美财報 " 影響,2 月 22 日英偉達股票暴漲 16%,市值增加了 2733 億美元,約合人民币 2 萬多億。按市值算,相當于 1 天就創造了 1 個貴州茅台或 3 個寧德時代。
美國 AI 大模型頻頻登上熱搜,美國的 AI 芯片廠商又是如此強勢。于是自然有人提問:為什麼人工智能的突破進展總是出現在美國?還有這樣一種擔心:Sora 等模型產品出現在美國,中國 AI 的發展變被動了麼?
針對這些問題,《環球時報》采訪了全國政協委員、360 創始人周鴻祎,他認為中美 AI 的差距主要在 " 确定技術方向 " 上,中國的優勢是學習能力很快,中美在 AI 上的差距應該能在一兩年内追上。
但周鴻祎的說法畢竟只是一家之言,美國 AI 企業在确定技術方向上的能力到底強不強?如果确實強,那又是強在哪裡呢?
确定技術方向,确有過人之處
與周鴻祎相反,部分網民出于樸素的民族感情,認為以 ChatGPT 為代表的 " 文生文 " 模型,以及 Sora 等 " 文生視頻 " 模型缺乏明确地工業适用場景,是一種屠龍術式的技術突破。盡管顯得技術高超,實際作用卻很小。甚至有人明确提出:美國 AI 務虛,中國 AI 務實,并認為中國 AI 發展路線遠較美國為強。
從細節上講,這樣的說法是有道理的。在 AI 產業中,熱門的研究問題通常具有兩個特征:
1. 人類不擅長,而計算機擅長;
2. 人類由于定勢思維和文化傳統,錯誤地認為這些問題集中體現了人類的 " 高級智慧 ",是人類擅長的問題。
從 AlphaGo 開始,到最近的 ChatGPT 和 Sora,都體現了這一規律。
例如,圍棋從來都不是人類擅長的,普通人早就下不過 AI 了。只是圍棋在東亞社會文化上具有較高的社會影響力,吸引了一大批記憶力遠超于常人的天才投身到這項運動中,使得 AI 需要發展這麼多年,才能追上人類最高水平選手。
圍棋在中日韓具有崇高的文化地位
同時,幾乎所有國家的傳統都認為在棋類運動中領先,需要較強的把握局面的能力以及深謀遠慮。并衍生出 " 入界必緩 "、" 攻彼顧我 "、" 勢孤取和 "、" 棋品如人品 " 等等文化諺語。但實際上,棋類比賽往往需要的是記憶和檢索大量信息的能力,而這顯然是計算機擅長的。
對于 ChatGPT,網民有這樣一個玩笑:" 除了用于工作的時候,ChatGPT 還挺智能的 "。雖然是玩笑,但精準反應了目前 " 文生文 " 模型的缺點。對内容相對固定的上傳下達等工作,這些技術還十分有用。一旦對内容的正确性和風格有要求,相關技術的效率就直線下降。
因此,這些模型只是基礎,還需要大量的标記和重新訓練,才能應用到實際的工業場景。
但若是據此得出結論:美國 AI 務虛,中國 AI 務實,筆者就很難苟同了。因為這正是美國 AI 廠商希望看到的。
黃仁勳呼籲各國建立主權 AI 基礎設施,他說:" 它編纂了你的文化、你的社會智慧、你的常識、你的歷史——你擁有你自己的數據 "。
從表面上看,這沒錯,ChatGPT 也好,Sora 也罷。如果能用各國本地語言重新進行标記和訓練,當然比依賴翻譯輸入的方式更好。
如果按黃仁勳的提議,各國都建立了主權 AI。人們難免會好奇美國的主權 AI 和其他國家的主權 AI 有什麼區别。
顯然,美國主權 AI 是擴張性的,在這裡投入的每一分錢,都能從國際上賺來多得多的錢。美國的主權 AI 具有最強的基礎功能性和技術擴散性,各國的主權 AI 能達到什麼水平和效率,深度依賴美國主權 AI 提供的工具。
很多國家即使主權 AI 建設成功,也是防御性的、自保性的、甚至面子性的,很多投入最後僅僅變成了一種消費,購買的還是美國的 AI 商品。同時,如果各個發展中國家把 AI 主權化,互不共享市場,必然造成大量的重復建設,美國 AI 芯片廠商則在這個過程中賺的盆滿缽滿,這才是真正的關鍵!
随着一些媒體,尤其是美國媒體對 AI 可能侵犯隐私權、AI 應用存在倫理風險、AI 威脅人類、AI 應用收益巨大等方面的過度渲染。AI 應用獲取必要數據的法律門檻和實際成本正在上升,這也為 AI 應用企業的未來發展蒙上了陰影。
同時,如果中國 AI 局限于應用,那就只能賺一點辛苦錢。AI 的落地需要海量數據以及冗繁復雜的數據标記。在目前 AI 應用的模式下,數據訓練的通用性不強。換一個行業甚至應用場景,就意味着基本需要重頭開始。因此 AI 應用企業做的再大,也還是勞動密集型的,這與產業轉型的方向背道而馳。
而只有做 AI 模型和做 AI 硬體的,因其技術擴散性強,才有可能實現 72.7% 的毛利率。中國產業鏈的 " 由大到強 ",從資本指标的角度上說,就是要把利潤率和產業規模都提高上去,因此中國 AI 的未來也要做關鍵技術(如 " 文生文 " 模型)和關鍵硬體。
因此,正如周鴻祎所說:" 我一直堅持這麼說,看到差距才知道怎麼迎頭趕上。承認差距不是壞事,認為我們所有都遙遙領先了,那就(不行了)"。中美 AI 企業的差距,尤其是在确定關鍵技術上的差距,是客觀存在的,不是宣傳出來的,更不是憑空造出來的。
前置技術起步早,是美國 AI 硬體強的最主要原因
與很多芯片相比,顯卡和大部分 AI 軟體使用的 GPU 芯片很晚才步入高速發展期。現在如日中天的英偉達,其實直到 1993 年才創立,1997 年才第一次推出高性能的 GPU 芯片,而 CPU 的巨頭英特爾早在 1968 年就創立了。即使是 2008 年前的英偉達,為 AMD 生產 PC 主機板也是其重要業務,并不是一家純粹的 GPU 設計企業。
因此在一些人看來,中國是有可能趕上 GPU 時代的,他們将現狀簡單地歸結為 " 管得太寬 " 和 " 道德審判 " 影響了中國遊戲的發展,進而拖累了 GPU 芯片和 AI。
這種說法是不客觀的。美國計算機發展很早,人才儲備相對充分。20 年前中國計算機人才相當匮乏,因此首先要布局門檻較低、應用性較強的領網域,先把規模做大。然後就是要對產業的 " 制高點 " 集中精力進行突破,避免被先發國家卡脖子。既不可能盲目追求 " 高精尖 ",也不可能只布局新技術。
馮諾依曼的計算機結構體系決定了 CPU 和内存是計算機硬體的核心。其中内存領網域競争相對充分,其技術分散在多個國家,通過内存 " 卡脖子 " 難度較大。而高性能的 CPU 基本上被美國壟斷了,也經常成為美國技術禁運的對象。
因此在新世紀之初,中國不得不首先集中精力,攻克高性能 CPU 的問題。龍芯、申威、飛騰等項目都是為了這一目的而生的。縱觀世界,不管是有發達遊戲產業的日本,還是沒有發達遊戲產業的俄羅斯均遵循了這一思路。即使有發達的遊戲產業,日本過去仍然将自主 CPU 作為日本信息產業重點突破瓶頸的項目,中國沒有在上世紀 90 年代和本世紀初重點發展 GPU 也就不足為奇了。
甚至美國的另一個芯片巨頭 AMD,也是在 CPU 有了較強的競争力後,才收購 ATI 進入 GPU 芯片設計領網域,并在今天成為一個雖與英偉達有較大差距,卻穩居綜合實力第二的 GPU 巨頭。
而且做 GPU 芯片的難度主要體現在軟體生态和商業運作上,把性能做到與目前頂尖水平差距不超過 10 倍,難度并沒有那麼大。正如龍芯總裁胡偉武所說:有了高性能 CPU,再做 GPU 就不難了。中國很早就解決了軍用 GPU 芯片的問題,甚至都沒引起多大的關注。
2022 年 10 月,英特爾時隔多年再次涉足遊戲獨立顯卡,其最高端的 A770 的理論性能幾乎達到了英偉達當時中高端遊戲顯卡的水平。國内的摩爾線程也緊随其後發布了國產顯卡天花板 MTT S80(售價 1199 元,少量發售),理論性能達到了當時英偉達的甜品卡水平。
國產顯卡天花板 MTT S80
當然在實際遊戲中,A770 體現不出理論性能,驅動也不夠完善。而國内的 MTT S80 則距離理論性能更遠,驅動更不穩定。但值得一提的是,通過一年多堅持完善驅動,MTT S80 在許多遊戲中的性能有了成倍的提高,發展勢頭令人欣喜。
定量地說,前文提到的 H100 單精度性能為 66.91TFlops。但這是英偉達專為 AI 設計的芯片,價格高達 2.4 萬美元,功耗達到 700W,十分誇張。當時英偉達最強的遊戲顯卡 RTX 3090 Ti 的單精度性能為 40.00TFlops,而英特爾的 A770 為 17.20TFlops,摩爾線程的 MTT S80 為 14.40TFlops。
可以說中國的顯卡與國際先進水平已不存在代差,而中國也成為美國之外唯一同時具備高性能自主 CPU 和自主 GPU 的國家。同時也說明了,中國在當時條件下的信息產業決策是沒有太大問題的。
至于美國 AI 芯片強一些,主要是由于先發優勢較大造成的。而中國的相對落後,主要是歷史上 " 缺課 " 太多," 補課 " 的影響太大造成的,對遊戲監管較嚴的影響被高估了。
監管彈性大," 助攻 " 英偉達的發展
不過站在英偉達的角度,它能成長為今天的巨頭,與美國對遊戲靈活的監管态度是密不可分的。
黃仁勳決定做英偉達時,已經在一家芯片設計企業 LSI Logic 做到了主管,并且有一兒一女,家庭也需要照顧。在做決定前,作為華裔,黃仁勳與父母有過一番溝通。當知道影像芯片的主要功能是玩遊戲時,他母親不禁發問:" 為什麼不找一份工作呢?"
黃仁勳回憶創業時與家人的談話(字幕由 Web3 天空之城制作)
顯然,如果黃仁勳母親的觀點在社會上占據了壓倒性的地位,美國的 GPU 芯片和遊戲產業是無論如何發展不到今天的程度的。
事實上,為了阻止孩子沉迷遊戲,美國家長采取過包括公開宣傳、遊說立法、抗議示威、要求通過相關法律、起訴遊戲開發商等等手段。作為教育的一種方式,部分家長采取了強制孩子參加夏令營等方式,希望他們能夠遠離 " 不良誘惑 " 和 " 電子垃圾 "。
伴随着對遊戲的抵制,美國社會同樣存在着反對過分限制遊戲的聲音。德州大學的經濟學家邁克爾 · 沃德以堅持用數據衡量遊戲的影響而聞名一時,根據他的研究,暴力遊戲從總體上與犯罪率無關。
最終美國對遊戲采取了靈活管控策略,像《Manhunt》這樣的遊戲,不僅血腥暴力,而且推崇通過獵奇的方式殺害遊戲中其他對象,還會誘導玩家消除痕迹,就被嚴格禁止。如果一款遊戲,已經出現了高度明确的模仿作案,也很有可能被禁止。
一些性質類似,但程度較輕的遊戲,則會被要求整改。為了避嫌,美國遊戲行業創造了 ESRB 等遊戲分級制度,通過互相監督的方式評級,對可能接觸暴力情節的玩家年齡進行了限制。未經分級的遊戲,則幾乎難以流通和購買。
此外,中國對遊戲限制也引得不少美國家長熱議:應當限制未成年人每日電子遊戲的時間。
目前對 AI 也有很多質疑甚至陰謀論的成分。AI 的缺點和弱點被淡化了,而優點則被不合常理的誇大了。影響最大的是幾乎不提目前 AI 應用的龐大成本,而無限拔高對產值的刺激作用。這種誤解深入人心,就很可能制約傳統企業與 AI 應用開發公司達成合作。
高效的投資孵化環境使新技術難被埋沒
對于美國 AI 企業而言,學術界和產業界的區别很小,甚至可以說先天就是高度聯合的。但這種聯合不是平等的聯合,創造商業價值的重要性明顯更突出一些。
Sora 模型的提出者 OpenAI 旗下的很多研究員發表過不少高水平的論文,但主要是寫作時間較短的會議論文,更耗時間的期刊論文則幾乎沒有檢索到。OpenAI 團隊曾将構建 Sora 模型的技術基礎投稿到知名會議 CVPR 2023,結果被以 " 缺乏創新 " 為由拒絕了,但最終被 ICCV 2023 接收。
論文首圖過于跳脫和行文不夠學術的風格,可能是被拒的重要原因
我想即使所有知名的學術會議都認為這項工作缺乏創新,OpenAI 的團隊也不會氣餒,因為他們已經在商業上證明了自己。整個 Sora 研發中燒掉的經費可能達到數億美元,大部分團隊沒有這樣的機會。
重倉 Sora 這樣一個還存在許多未被解決的重大挑戰的模型,而且商業前景尚不明朗,每個投資人恐怕都需要慎重地思考。但沒有這樣的風險投資,科技進步的速度就不會這麼快。
市場和高校兩條腿走路,有利于促進科技創新。如果市場對技術前景的甄别作用不強,或者幹脆放棄投資前人沒有做過的東西。那麼即使出現一些產業化特色強的研究,也往往是 " 功夫在詩外 " ——強調產業應用特色是為了獲得更好的論文發表機會,最終還是難免科研與產業兩張皮的問題。
英偉達當時也是被孵化的幸運兒,作為第一家明确提出以開發 3D 影像處理芯片為己任的公司,幾乎沒有投資者知道這樣的芯片有什麼用。當時的 2D 影像處理芯片已經比較完善了,而且 2D 影像處理芯片的市場潛力好像已經不大了。根據親歷者的回憶,很多投資人是在不理解的情況下,通過過去風險控制評估經驗,并基于對黃仁勳等創業者的信任進行了投資。
這樣的投資一定是有風險的,可是有相當一部抽成功了,而且回報巨大。不難想象,在這樣的環境中一種具備產業前景的新技術是很有可能得到大規模應用的。
坦白地說,目前我們的高技術投資環境與這樣的目标還存在着差異。但筆者對未來充滿着信心。
如果說過去沒有首先發展 GPU 芯片,是 " 補課 " 的需要和時代的局限,那麼投資環境也不是一成不變的。随着高等教育率的提高,以及成熟領網域的商業競争愈發白熱化,國内投資的品味和風險偏好也必然向科技驅動轉變,而且可能很快就會發生。