今天小編分享的科技經驗:中國芯片產業的一次底層突圍,AI芯片創企勇挑RISC-V标準制定大梁,歡迎閱讀。
生成式 AI 攪動芯片三大架構生态,中國 AI 芯片創企首次主導底層技術突破。
作者 | 雲鵬
編輯 | 漠影
過去幾年生成式人工智能(GAI)的快速發展,讓所有主流指令集架構迎來了一次重要更新潮。
從 x86、Arm 到 RISC-V,都在制定面向矩陣(Matrix)指令集方向的擴展,因為 GAI 應用的大部分典型負載的核心運算都需要使用矩陣計算。
2021 年,Arm 宣布在 ARMv9-A 架構中引入 Scalable Matrix Extension(SME)指令集擴展;2023 年初,英特爾正式推出了第 4 代英特爾至強可擴展處理器,集成了 Advanced Matrix Extensions(AMX)指令集。
2023 年底,RISC-V 國際基金會同時成立了 2 個矩陣指令集擴展技術組(Attached Matrix Extension TG 和 Integrated Matrix Extension TG),計劃用一至兩年的時間完成新指令集的制定,其目的就是要加速矩陣運算,從而提高機器學習和 AI 應用的性能。
就在最近,希姆計算在 RISC-V 美國峰會上發布了其 RISC-V 矩陣擴展開源項目的最新 0.5 版本 , 行業内率先支持了向量 + 矩陣的實現。
這家年輕的中國創企也成為首家向全球社區提交完整 RISC-V 矩陣指令集及其支持工具的公司。這一舉措無疑會推動 RISC-V 矩陣指令集國際标準的快速形成,提高 AI 應用的兼容性、降低軟體開發适配成本,推動整個 RISC-V 生态系統的發展。
對此,RISC-V 國際基金會首席執行官 Calista Redmond 給予了高度評價,她說到:" 看到像希姆計算這樣的創新項目積極采用和支持了 RISC-V 的新特性,真是令人鼓舞。矩陣指令集擴展代表了 RISC-V 生态系統向前邁出了重要一步,能夠在特定應用場景中顯著提升性能。我們對希姆計算團隊的努力表示感謝,這對整個社區來說是一個巨大的勝利。"
中國電子工業标準化技術協會 RISC-V 工作委員會技術委員會主任、國家工業信息安全發展研究中心總工程師周平說到:" 非常高興看到作為 RISC-V 工委會副理事長部門的希姆計算,在推動 Matrix 國際标準方面所做的貢獻,特别是在開源 SCOOP 項目上的努力令人印象深刻。希姆計算不僅展示了卓越的技術能力,還體現了開放合作的精神,這對于促進 RISC-V 在 AI 領網域指令集擴展的發展具有重要意義。我們期待希姆計算繼續在工委會、在國際社區積極發揮作用和協作精神,為行業帶來更多的創新與進步。
AI 新時代,中國芯片企業正集體一步一步走到制定國際标準的行業領導者行列中。
01.
生成式 AI 掀起矩陣計算革命,
RISC-V 或成做 AI 最佳選擇,标準統一是關鍵
進入生成式 AI 時代,RISC-V 很可能會成為做 AI 的最佳指令集架構。
首先,正如前文所提到的,RISC-V 可以憑借開源的模塊化設計去賦能開發者,讓 AI 芯片可以針對不同負載做加速,同時兼顧良好的可編程性和通用性。
面對生成式 AI 帶來的需求、場景爆發,這樣的特性顯然是非常關鍵的。
此外,在 AI 新時代,基于 RISC-V 的開源方案可以最大程度保證國家層面對數據安全的掌控,還一定程度上打破既有的行業壟斷态勢,同時還能兼顧產業生态的融合,可以說是商業模式潛力最大化的解決方案。
明确了 RISC-V 的方向,如何讓 RISC-V 可以更好地支持 AI 應用?标準的統一就成為了接下來的重中之重。
一旦矩陣擴展指令标準确定下來,全球 RISC-V 生态中的開發者都可以用一樣的矩陣指令來做自己的芯片,這樣軟體應用層面就會有更多的融合機會,應用也能實現真正的通用性,就如同基于安卓系統的應用生态。
基于這一統一标準,各類產品都将快速生長,工具連、基礎軟體也将逐漸完善,這對于 RISC-V 在應用層面與 x86 和 Arm 生态競争十分關鍵。
從生态角度上來說,制定好這樣一套全球範圍内都可以接受的、基于 AI 方向的矩陣擴展指令集标準,意義非常重大。
RISC-V 的優勢在于開源,但劣勢也在于此:如果指令集不統一、" 各自為戰 "、就會有碎片化的問題。
目前包括谷歌、高通、Meta等全球頭部科技巨頭都在往 RISC-V 矩陣指令集擴展及相關标準統一的方向上努力,這進一步證明了這一方向的正确性。
而國内 AI 芯片創企希姆計算,正成為其中跑的最快的一個,成為這一領網域中中國芯片企業的代表,在國際行業标準的制定方面将話語權掌握在了自己手裡。
02.
從芯片指令集創新到產業化落地,
希姆計算打通 RISC-V AI 應用全鏈條
正如前文所說,新标準的統一成為 RISC-V 生态在 AI 新時代最需要解決的問題,也成為全球科技巨頭競争的焦點。希姆計算這次在标準制定過程中的亮眼表現,赢得了國際基金會和業界的廣泛認可。
根據官方信息,目前希姆計算的 RISC-V 矩陣擴展開源項目已更新至 0.5 版本,支持了向量 + 矩陣的實現。
具體來看,最新的 RISC-V 矩陣指令集采用了 Tile-based 的矩陣乘法架構設計,在原有基礎上進一步完善了編程模型和類型支持,同時提供了基本版 32 位指令編碼。
此外,通過參數化寄存器架構和模塊化類型系統,新的 RISC-V 矩陣指令集能夠适應從邊緣到雲端的各種應用場景。
值得一提的是,為了進一步推動标準化和商業實施,希姆計算還更新了一系列工具,包括基于 LLVM 的編譯器、基于 Spike 的模拟器、基于 GDB 的調試器,以及基于 SCOOP(Stream Computing Out-of-Order Processor)平台的開源核心實現,其包含對 RVV 和 RV Matrix 的支持。
站在今天的 0.5 版本回顧過去三年,希姆計算可以說實現了 " 從量變到質變 " 的積累。
從 2022 年 9 月 RISC-V 矩陣 ISA 規範 0.1 版本完成、首次向 RISC-V 國際基金會提交開源提案和支持工具,到 2023 年與達摩院建立了協商機制、共同探索 RISC-V 矩陣指令集。
用希姆計算執行副總裁陳炜博士的話來說,指令集的設計、功能的完善補充,是一個不斷的學習和演進的過程,逐漸從非标到标準化,與國際上達成的共識相一致。
此外,指令集從設計到應用落地也充滿挑戰,比如仿真驗證、DEBUG 等方面相關軟體的完善,以及面對 AI 應用在算子庫層面的更廣泛支持。
由于目前矩陣指令集的國際标準還沒有定下來,相關配套的軟體工作量是非常大的,希姆計算團隊投入了大量資源來完善相關工作。
值得一提的是,希姆計算的獨到優勢之處在于,其不光完成了指令集的開發工作,還進一步實現了產業化,也就是對大模型的适配以及應用的落地。
就在本月早些時候,RISC-V 國際基金會正式刊發的《希姆計算基于 RISC-V 計算能力和大型語言模型(LLMs)提供智能社區服務》一文,基于自主研發的 RISC-V 芯片和推理加速卡 STCP920,希姆計算給 LLM 應用創建了一個集成 RISC-V 硬體和軟體的生态系統。
這個生态系統包括一個智能計算雲平台、行業 LLMs、數據治理平台和一個智能代理開發平台。基于這套系統,希姆計算為廣州某社區定制開發了一個便捷的社區服務助手。據稱該助手可以提供 37 類、超 2000 項服務,社區服務咨詢的準确性從原來的 30% 提高到了現在的 95% 以上。
在 AI 推理性能方面,STCP920 AI 加速卡已經經過國内頭部互聯網廠商 50 多個模型測試,平均下來,希姆計算的 12nm 板卡推理性能是英偉達 7nm A10 的 108%,可以說是兼顧通用性和高性能的解決方案,也是全球第一個量產的基于 RISC-V 的 AI 推理卡。
尤為重要的是,希姆計算采用的 12nm 工藝節點可以很好地規避制程受限的問題,無論是 TSMC 南京工廠還是中芯國際都可以支持這一工藝節點。
03.
将底層技術标準制定握在自己手裡,
中國科技產業或實現歷史性突破
在完成自身技術和產品體系化、產業化的基礎上,希姆計算進一步積極推動 RISC-V 行業新标準制定的舉措,給全球芯片產業各方帶來了重要價值,對中國科技產業發展也有着歷史性意義。
對 CPU 廠商來說,有了完整指令集以及各種擴展支持,CPU 增加 AI 相關的特性功能就會更加便利;SoC 芯片公司也可以針對不同方向做更多的組合,根據應用場景來做更好的芯片設計。
此外,對于在 " 大算力 " 領網域做 AI 加速器的公司來說,指令集标準的完善對軟體生态和應用的建設都非常有幫助。
今天,從數據中心到車載、機器人、AI PC、AI 手機、AIoT,不同場景都有不同的公司在聚焦,如果能夠在芯片指令集架構層面形成統一,各家的軟體生态就可以更好的融合。
千變萬化的應用都可以追溯到同一個基礎指令集,将非常有助于整個產業的蓬勃發展。
除了對全球芯片產業的重要推動作用,0.5 版本的發布對中國科技產業在全球市場掌握更多話語權也有着重要意義。
0.5 版本的發布,意味着中國公司為國際社區作出了重要貢獻,并且在關鍵的标準制定層面跑在了前面。
正如希姆計算 CEO 梅迪所說,如果中國企業能先行一步,成為标準的主要制定者和推動者之一,就可以讓國内的軟體和應用生态能夠更多的被國際接受、一起融合發展。
這也是為什麼要有更多中國公司來做這件事,去為标準的統一做貢獻,去盡可能多的争奪話語權。
今天,放眼芯片、AI 乃至整個科技產業,受到地緣政治的影響,隸屬于一個國家的一套技術路線往往都難以推廣至全球範圍内被積極采用。
但同時產業又呼籲生态的融合發展,因此唯一的解決方式就是采用一套不隸屬于任何國家的開源技術路線,這也是 RISC-V 方案的突出優勢之一。
在當今國家數據資產治理和轉型的關鍵發展階段,一個開放、穩定、安全、融和、去中心化以及保持和國外接軌的算力底層技術路線顯得尤為重要。
縱觀信息時代全球科技產業的發展,中國在絕大部分重要的底層技術路線上,都沒能将标準化工作掌握在自己手裡,要做到底層技術話語權的掌控,是非常難的一件事。
而今天希姆計算推動 RISC-V 在 AI 方向上的一系列标準制定工作,顯然是有重大意義的,也必然會在未來展現出巨大價值。
04.
結語:在芯片產業 " 種樹 ",
希姆計算瞄準的是 AI 更大的未來
從 2019 年選擇差異化市場競争、布局 RISC-V 相關技術,到 2022 年自研 AI 加速卡踩中大模型風口,再到如今全球 RISC-V 矩陣擴展指令集标準的建設成為必須要做的事情。
從摸着石頭過河到如今產業化落地,希姆計算無疑是在全球 RISC-V 生态建設中走的最早的一批中國企業。他們從幕後走到台前,從摸索追趕到推動矩陣指令集标準的完善,領跑細分賽道。
用梅迪的話來說,希姆計算希望把自己的技術路線、方案等沉澱下來,争取讓行業中其他公司可以跟随,從而實現對行業的引領。
從底層做起、扎扎實實,雖然初期挑戰重重,但完成後卻能夠迸發出巨大商業化潛力。
希姆計算所做的事情就好比在芯片產業中 " 種樹 ",而種一棵樹,最好的時間就是今天。
科普視頻
2024 年,AI 步入推理時代,能耗成為算力性能破局的關鍵因素。聯想集團發布《Game of AI》系列科普視頻第二集《數據中心:如何與世界交換算力》,揭開了數據中心百年歷史中明暗交織的角逐畫卷。聯想集團不斷引領液冷技術向前,持續推動數據中心架構的革新,促進算力在各行各業的持續發展,助力加速進入人本智能的新時代。
>