大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

老黃發布新核彈B300,英偉達:B200已破DeepSeek-R1推理世界紀錄

2025-03-19 简体 HK SG TW

今天小編分享的科學經驗:老黃發布新核彈B300,英偉達:B200已破DeepSeek-R1推理世界紀錄,歡迎閱讀。

皮衣老黃,帶着最強 AI 芯片 GB300閃亮登場 "AI 超級碗 "GTC,燃爆全場!

性能方面,和去年發布的 GB200 相比,推理性能是其 1.5 倍。

據悉,GB300 将在今年的下半年出貨。

除此之外,老黃還預覽(2026 年下半年發貨)了英偉達下一代 AI 超級芯片,名字大變樣——Vera Rubin。

其實它的命名規則和 Grace Blackwell(GB)類似:Grace 是 CPU,Blackwell 是 GPU。

而 Vera Rubin 中的 Vera 是 CPU,Rubin 是 GPU。根據老黃的說法:

幾乎所有細節都是新的。

從預覽的性能來看,Vera Rubin 整體性能更是 GB300 的3.3 倍。更具體一些:

Vera:CPU 的内存是 Grace 的 4.2 倍,内存帶寬是 Grace 的 2.4 倍。

Rubin:将配備 288GB 的 HBM4。

在 Vera Rubin 之後的下一代 GPU(2027 年下半年),英偉達會将其命名為 Rubin Ultra,性能直接拉到 GB300 的14 倍。

一個直觀的對比,如下圖所示:

更多的具體性能對比,是這樣的:

性能上的提升,也正應了老黃在現場說的那句話:

大規模推理是一種極限計算。

Inference at-scale is extreme computing.

不僅如此,就連 Rubin 之後的下一代 GPU,老黃也給亮出來了——将以Feynman來命名。

而縱觀整場 GTC,我們可以輕松提煉老黃提及最多的幾個關鍵詞:tokens、推理和Agentic AI。

但除此之外,還有一個比較有意思的關鍵詞——DeepSeek。

英偉達官方博客稱:

實現了 DeepSeek-R1 推理性能世界紀錄。

每個用戶每秒可處理超過 250 個 token;實現每秒超過 30000 個 token 的最大吞吐量。

但這項紀錄采用的是 B200,英偉達表示随着 Blackwell Ultra 等新 GPU 的出現,紀錄還将繼續被打破。

而老黃在現場體現傳統 LLM 和推理 LLM 的區别時,也是拿着 DeepSeek-R1 來舉例:

嗯,微妙,着實有點微妙。

那麼除了一系列新 GPU 之外,還有什麼?我們繼續往下看。

推出兩款個人 AI 超級計算機

首先,第一款個人 AI 超級計算機,叫做DGX Spark。

它就是老黃在今年 1 月份 CES 中發布的那個全球最小的個人 AI 超級計算機 Project Digits,這次取了個正式的名字。

DGX Spark 售價3000 美元(約 21685 元),大小和 Mac Mini 相當。

它采用的是英偉達GB10 芯片,能夠提供每秒 1000 萬億次的 AI 運算,用于微調和推理最新 AI 模型。

其中,GB10 采用了 NVLink-C2C 互連技術,提供 CPU+ gpu 的相幹内存模型,帶寬是第五代 PCIe 的 5 倍。

值得一提的是,英偉達官網已經開發預定了哦 ~

至于第二款個人 AI 超級電腦,則是DGX Station。

DGX Station 所采用的,正是今天推出的 GB300,也是首個采用這款芯片的 AI 電腦。

其性能如下:

擁有 784GB 的相幹内存空間

擁有英偉達的 ConnectX-8 超級網卡,支持高達 800Gb/s 的網絡速度

擁有 Nvidia 的 CUDA-X AI 平台,可訪問 NIM 微服務和 AI Enterprise

用老黃的話來說就是:

這就是 PC 應該有的樣子。

This is what a PC should look like.

至于上市趕時間,則是将于今年晚些時候從華碩、BOXX、戴爾、惠普、Lambda 和美超微等廠商處推出。

△搭載 GB300 的 DGX Station 主機板

而根據英偉達官方的介紹,這兩款個人 AI 超級計算機,是面向研究人員、數據科學家、AI 開發者和學生設計的。

除此之外,老黃在這屆 GTC 上還涉足了以太網,推出全球首個面向 AI 的以太網網絡平台——Spectrum-X。

它由英偉達的 Spectrum-4 以太網交換機和 BlueField-3 SuperNIC 共同發力,能為 AI、機器學習和自然語言處理等提供高性能支持。

相比傳統以太網,Spectrum-X 可将 AI 網絡性能提升 1.6 倍,提高 AI 雲的電力效率。

以及還包括基于矽光學的 Spectrum-X Photonics 和 Quantum-X Photonics 網絡交換平台,用于使用矽光學的超大規模數據中心。

新的網絡交換平台将端口數據傳輸速度提升至 1.6Tb/s,總傳輸速度達到 400Tb/s,使數百萬個 GPU 能夠無縫協同工作。

還開源了一系列軟體

除了硬體,英偉達這次在軟體開源方面也有幾個新動作。

其中最重磅的,當屬發布NVIDIA Dyamo,一個用于加速 AI 模型推理的分布式推理服務庫。

老黃将其稱為 "AI 工廠的作業系統 ",核心目标在于提高推理性能的同時降低 Test-Time 算力消耗。

按照英偉達的說法,在 NVIDIA Blackwell 上使用 Dynamo 優化推理,能讓 DeepSeek-R1 的吞吐量提升 30 倍。

至于背後原因,主要在于 Dynamo 可以通過動态調整 GPU 資源應對請求波動,并優化數據解除安裝到成本更低的存儲設備,從而降低推理成本并提高效率。

目前 Dynamo 已完全開源,支持 PyTorch、SGLang、NVIDIA TensorRTyTM 以及 vLLM,在 GitHub 獲取後即可将推理工作分配到多達 1000 個 NVIDIA GPU 芯片。

此外,英偉達還宣布開源新的 AI 推理模型—— Llama Nemotron,該系列模型也曾出現在今年 1 月的 CES 上。

據介紹,Llama Nemotron 基于開源 Llama 基礎模型構建,采用英偉達最新技術和高質量數據集進行剪枝和訓練,優化了計算效率和準确性。

為了直觀展示其性能,老黃在大會上将它和 Llama 3.3(70B)以及 DeepSeek R1 Llama (70B)進行了對比,下圖展示了它們在 Agentic 任務上的平均準确率(橫軸)與每秒處理的 tokens 數量(縱軸):

可以看出,新的推理模型以 49B 參數量性能遠超另外兩個模型,在 Agentic 任務中表現更為突出。

目前 Nano 和 Super 模型可在 NIM 微服務中獲取,Ultra 模型即将推出。

與此同時,英偉達在自動駕駛和具身智能方面也有新進展。

大會開始不久,老黃即宣布英偉達與通用汽車達成合作:

通用将在自動駕駛上使用英偉達的 AI 技術。

在這之後,英偉達正式發布了端到端自動駕駛汽車全棧綜合安全系統NVIDIA Halos。

這個系統主要将 NVIDIA 的汽車硬體和軟體解決方案與尖端 AI 研究相結合,以确保從雲端到車輛的自動駕駛汽車(AVs)的安全開發。

介紹過程中,老黃多次提到了 " 安全性 " 這個詞,并公開聲稱:

我們是世界上第一家對每一行代碼進行安全評估的公司

落實到具體上,Halos 系統主要在三個互補的層面提供支持:

技術層面:包括平台安全、算法安全和生态系統安全;

開發層面:涵蓋設計階段、部署階段和驗證階段的安全防護措施;

計算層面:從 AI 訓練到部署的全過程,利用三種強大的計算平台,分别是 NVIDIA DGX 用于 AI 訓練,NVIDIA Omniverse 和 NVIDIA Cosmos 在 NVIDIA OVX 上運行用于模拟,以及 NVIDIA DRIVE AGX 用于部署。

到了大會的最後階段,老黃宣布英偉達與 Google DeepMind 和 Disney Research 正合作開發下一代開源仿真物理模型 Newton。

據英偉達介紹,Newton 基于 NVIDIA Warp 構建,支持與 MuJoCo Playground 或 NVIDIA Isaac Lab 等學習框架兼容。

它主要用于機器人模拟訓練,使用之後可以幫助研究人員安全、加速且低成本地訓練 / 開發 / 測試 / 驗證機器人控制算法和原型設計。

同時,英偉達還同步推出了  Isaac GR00T N1,号稱全球首個開源的、完全可定制的人形機器人基礎模型。

它采用雙系統架構,靈感來自人類思考模式,包括快速思考的動作模型(System 1)和慢速思考的決策模型(System 2)。

在大會演示中,GR00T N1 能夠輕松泛化常見的任務,如抓取、移動物體以及在雙臂之間轉移物品,或執行需要長時間推理的復雜任務。

最後的最後,老黃在謝幕之前還成功 " 召喚 " 出了配有 GR00T N1 模型的機器人—— Blue(星球大戰機器人)。

雖然過程中有些不聽話的 " 叛逆行為 ",但好在還是給了點老黃面子(doge)。

One More Thing

今年的 GTC 大會,除了老黃的主題演講,還有一件事最值得期待:

那就是今年首次設立的 " 量子日 " 活動,屆時老黃将與 D-Wave Quantum 和 Rigetti Computing 等十餘家量子計算行業領軍企業的高管同台,讨論量子計算的技術現狀、潛力以及未來發展方向。

要知道今年年初時,老黃一句 " 量子計算還需 20 年才實用 ",相關概念股曾應聲腰斬。

所以大家這次都在觀望,老黃是否又會 " 語出驚人 ",相關探讨是否會對量子計算產業產生更大影響。

咱們繼續坐等答案揭曉 ~

老黃演講回看地址:

https://www.youtube.com/watch?v=_waPvOwL9Z8

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—  完  —

最後一周!2025 年值得關注的 AIGC 企業產品 報名即将截止

下一個 AI" 國產之光 " 将會是誰?歡迎申報獎項!

本次評選結果将于 4 月 16 日中國 AIGC 產業峰會上公布。

一鍵星标

科技前沿進展每日見

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們