今天小編分享的互聯網經驗:不到15萬元!清華90後團隊發布“褐蟻”一體機,已支持阿裡最新Qwen3模型,歡迎閱讀。
行雲集成電路創始人、CEO 季宇
4 月 30 日消息,钛媒體 AGI 獲悉,清華 90 後創立的北京行雲集成電路有限公司(簡稱 " 行雲集成電路 ")宣布,推出全新的一體機產品 " 褐蟻 ",僅需最高 15 萬元就可以跑滿血版 DeepSeek R1/V3 大模型,并且對話速度達到了 20token/s。
今天下午,行雲集成電路創始人、CEO 季宇對钛媒體 AGI 表示,目前 " 褐蟻 " 一體機已經支持阿裡最新發布的 Qwen3 系列開源大模型,包括頂配版 Qwen3-235B-A22B。
具體來說," 褐蟻 " 一體機有三款不同的配置:最高性價比的 " 超大杯 " 褐蟻 HY90,搭載雙路 AMD EPYC 9355 伺服器、24 條 48G 6400M 頻率内存和 NV 5090D 計算卡,支持 FP8、INT4 兩種數據精度,在 FP8 精度下跑滿血版 DS 能達到 21token/s 的對話速度,在 INT4 精度下則能達到 28token/s,最高支持 128K 的上下文,售價 14.9 萬元;此外,行雲集成電路還将推出 " 大杯 " 褐蟻 HY70、" 中杯 " 褐蟻 HY50 兩個配置版本。
季宇團隊表示,行雲通過對推理引擎的獨家優化提升了推理效率,是國内首個在 10 萬價位提供滿血 FP8 精度模型 20+tps 速率的一體機產品,并且可配置各類調用大模型 API 的應用。
據悉,行雲集成電路成立于 2023 年 8 月,其核心團隊主要來自清華大學及全球頂尖芯片公司,致力于研發下一代針對大模型推理場景的高效能 GPU 芯片,創始人包括季宇,以及公司 CTO 餘洪敏。
其中,31 歲的季宇是清華大學物理本科、計算機體系結構方向博士,也是 " 華為天才少年 " 之一,主攻體系結構、AI 芯片方向。而在華為期間,季宇曾是海思昇騰芯片編譯器專家,負責多個昇騰編譯器項目,同時作為研究科學家,展開 AI 編譯器領網域和處理器微架構網域諸多挑戰性問題突破瓶頸;類腦計算機體系結構《自然》論文共同一作,中國計算機學會 CCF 優博獎得主。
2024 年 11 月,行雲集成電路宣布完成總額數億元的天使輪及天使 + 輪融資,投資方包括智譜 AI、仁愛集團、中科創星、奇績創壇、水木清華校友基金、嘉御資本、春華資本、同創偉業、峰瑞資本等機構。
季宇早前表示,當機器的門檻低到消費級可以接受的成本,邊際成本承擔的商業模型也會發生變化,帶來進一步的產業繁榮。如果計算機體系能支撐消費級可以接受的價格享受極致的 AI 體驗,大模型產業會進一步進入一個類似軟體行業零邊際成本的超高速爆發期。
事實上,目前多家芯片、伺服器、雲計算、運營商、AI Infra 等領網域的公司都發布了 DeepSeek 一體機產品,堪稱 " 百機大戰 ",但其中可以運行滿血版 DeepSeek-V3/R1 模型的企業并不多,目前國產 GPU 芯片層面主要有壁仞科技、摩爾線程等。
據第一财經引述券商數據,預計到 2027 年,國内一體機的市場規模将超過 5000 億元,超過 30 家企業已向市場推出了一體機產品。
一位行業人士早前對钛媒體 AGI 表示,一體機核心解決的是部署易用性問題。相比復雜的雲計算解決方案,項目落地周期更快、私有化安全性更高、價格更有性價比,但 DeepSeek 一體機比較大的問題在于持續維護、更新以及大規模數據調度等,以及一體機綜合使用成本沒有辦法復用。
" 從當年數據庫年代,一體機就興起,這個大家非常喜歡,但不同的一體機,裡面的東西差别是非常大的。DeepSeek 出來以後,DeepSeek 一體機爆火,我跟一些領導也聊過,數據中心算力這塊賣得特别好,但都是短期租賃,因為本身硬體固定資產的年限也就 4 到 5 年。所以,我們可以看到一體機比較大的問題是以後持續性的維護、更新以及大規模數據調度等,比如 DeepSeek 一體機是很新鮮,但是大模型演進非常快,現在 DeepSeek 已經不是最領先的了,其他公司也能升上去,而客戶本身可能根本沒有這方面的技術能力。" 上述人士表示,推理一體機只是過渡态產品,最終大模型還是要和雲計算進行結合,當整個技術成熟以後,跟多雲整合,最後會變成雲平台的一部分。
對此,在季宇看來,現在一體機依然能夠跑得動超大杯的 MoE 模型和 30b 當量的 dense 模型,後續模型迭代其實還好。據悉,相比其他一體機產品,行雲集成電路的 " 褐蟻 " 在顯存、KTransformers 等層面有更多的技術研發能力。
據钛媒體 AGI 了解,下一步,行雲集成電路将自研 GPU 卡,持續帶來更低價格,更高 tps 體驗,并且還将實施由 30 台褐蟻一體機組成的 " 蟻群 " 方案,進一步發揮分布式系統優化能力,或将支持 500-1000 的有效并發數,而價格有望降至 300 萬 -400 萬元——低于英偉達 HGX H200 集群的整體硬體成本。
钛媒體 AGI 分析認為,從整個商業市場的視角來看,當前國内有很多人都投身于一體機、AI Infra,以及 GPU 伺服器等類似算力 " 賣水人 " 工作。随着推理模型技術迅猛發展,大規模算力投入被質疑,所以國内 AI 算力行業是否将如同 AGI 基座模型市場一般,經歷大浪淘沙後最終僅剩下大廠及頭部的幾家企業,還是說依然會有更多人 " 卷 " 性價比,這一點仍有待進一步觀察。
根據規劃,季宇的最終目标是:為 AI 構建 x86,目标是讓 AI PC 與互聯網底座重回組裝機模式(PC 及伺服器),将組裝機打造成 AI 基座,低成本搭建高端大模型,激活 AI 伺服器組裝機體系,讓大家能組裝出支撐高端 AI 應用的設備,帶動體系運轉。
(本文首發于钛媒體 App,作者|林志佳)