今天小編分享的科技經驗:英特爾Piuma來了!1.384億線程,秒殺一眾X86芯片,歡迎閱讀。
來源:雷科技數碼 3C 組 | 編輯:TSknight | 排版:LIN
去年 3 月份,英特爾在更換了新的 CEO 後,除了加大力度推進各個現有領網域的研究計劃外,還将投資的目光看向了固有市場之外的領網域,比如正在悄然崛起的 RISC-V。
RISC-V 對于多數人而言或許都是一個陌生的名詞,但是在半導體領網域,這個架構正在吸引越來越多的投資和關注,在國内,RISC-V 被認為将會是我們彎道超車的機會,如阿裡、華為等國内科技巨頭都在押注該架構。
實際上,RISC-V 已經成為繼 x86 和 ARM 之後的第三大架構,在全球市場占有一定的份額,當然,如果計算具體的份額占比,那麼 RISC-V 距離 x86 和 ARM 還有一段相當遙遠的距離。RISC-V 的前身 RISC,是曾經一度與 CISC(x86)并駕齊驅,甚至在伺服器等領網域的占比還超過了 CISC。
圖源:wiki
後來的故事大家都已經知道了,在與 CISC 的戰争中,RISC 最後成為落敗的一方,市場被 x86 完全占領,随後整個 RISC 陣營近乎土崩瓦解,不少公司都開始轉投其他市場和架構。但是,仍然有人沒能忘記 RISC,經過多年的整合與調整,被命名為 RISC-V 的第五代 RISC 架構正式發布,以此為基礎,一個全新的 RISC 聯盟成立,華為等企業目前都是該行業聯盟的高級會員。
在 RISC 聯盟的高級會員名單中,英特爾的名字顯然是最顯眼的,作為曾經以一己之力擊敗 RISC 陣營的公司,英特爾主動加入這個聯盟總有一種 " 黃鼠狼給雞拜年 " 的感覺。不過,現在看來英特爾并非來攪局的,他們對于 RISC-V 架構有着自己的獨特認知,并且正在将這個架構應用到自己的新產品線中。
圖源:RISC-V
" 最了解你的,往往是你的敵人 ",作為 RISC 架構曾經以及未來的最大對手,英特爾對 RISC 架構的研究其實一直沒有暫停,所以也讓他們有着更多的資本來融入這個新的聯盟。在去年 3 月宣布投資 10 億美元進行 RISC-V 架構的處理器研發後,經過一年半的時間,英特爾正式向外界公布了自己的成果—— Piuma。
Piuma 是一顆特殊的芯片,特殊在于它雖然只有 8 個核心,但是卻有 528 個線程,單核擁有 66 個線程,可以說在 Piuma 面前,單論多線程性能所有的 x86 芯片都要自愧不如。令人驚訝的線程數背後,還有更恐怖的互聯性能,基于特殊設計打造的光學互聯芯片,可以讓最多 131072 個 Piuma 芯片互連,組成一個擁有 1680 萬個核心,1.384 億個線程和 512PB 共享内存的龐然大物。
圖源:intel
在這個規模的處理器陣列面前,傳統的 x86 架構伺服器多少有點不夠看,在英特爾設計人員的計劃裡,Piuma 能夠以傳統處理器百倍的速度處理圖形分析工作。
不過,Piuma 并非一個很新穎的概念,類似的產品此前也誕生過,那麼 Piuma 的特殊之處在哪裡呢?特殊在英特爾聯合另一家公司,為其打造了一個特殊的光纖互聯系統。
圖源:intel
在光纖的幫助下,Piuma 的互聯帶寬高達 1TB/s,使其能夠快速傳輸數據,而且相較于傳統的銅線連接,光纖的延遲要低很多,使得大規模處理器陣列的搭建變得更加輕松。
或許大家都會好奇,傳統的 x86 處理器往往只能做到單核雙線程,Piuma 是如何做到一核六十六線程的?又是如何在獲得充足的多線程性能同時保持一定單線程處理能力的?
據英特爾介紹,Piuma 芯片内設計有六個數據管道,其中四個中内置了 16 個線程,用于處理零散且多的數據,此外還有兩條管道則是單線程設計,線程性能是多線程管道中單條線程的八倍。
圖源:intel
有點類似于如今主流 x86 處理器所采用的大小核設計,只不過兩者的順序有所調換,多線程管道低主頻但是多并發,主要負責處理零散任務,當遇到需要更多性能去處理,或是任務集群執行到最後一個任務線程時,處理器會将任務轉交給單線程管道,騰出多線程管道空間運行下一個任務。
如此一來就能最大限度地利用各個線程,同時處理大量的零散數據,在遇到偶然的大體量任務時,則可以由高性能的單線程管道進行處理,避免其長時間占用多線程管道。
同時,Piuma 的八個内核都有獨立的定制 DDR5 内存控制器,加上精簡指令集的幫助,可以讓單個最低訪問粒度為 8 字節,遠小于普通 x86 處理器的 72 字節,意味着 Piuma 可以更精準的調整内存占用,使得單核超線程的性能不會受制于内存調用。
傳統的 x86 架構處理器面對這些低負荷卻繁多的任務需求,往往難以發揮出單個線程全部的性能,100% 的性能卻只發揮出 10% 甚至更少,而且還無法同時對多個任務進行處理,導致性能大幅度空置。
x86 架構的優劣勢就是如此,雖然該架構可以打造出目前半導體市場中單線程性能最強的處理器,但是面對多而小的任務時,疲弱的多線程設計往往讓 x86 架構處理器無所适從。在這個方面,ARM 的表現都遠優于 x86,随着圖形分析等小體量卻多次數的任務需求增加,x86 架構已經難以應對這些繁復的工作。
但是,x86 所不擅長的工作,卻恰好是 RISC-V 的強項,作為一個更精簡、高效且開放的架構,RISC-V 的設計師可以輕松進行針對性修改,只需要遵循基礎的指令集,就可以在此基礎上打造出專屬的處理器。
簡單打個比喻,如果你想打造一輛車,要求是在直線跑道裡跑得足夠快,x86 卻依然要求你留下諸如刹車、方向盤、轉向裝置等各種普通汽車該有的結構。而在 RISC-V 裡,你可以将兩個輪子裝在一個火箭發動機上,然後宣布這就是你的新車,它或許無法處理多樣化的任務,但是卻能夠跑出最高的直線速度。
RISC-V 的優勢在于其不同于 x86 的指令集邏輯,RISC-V 可以更高效地處理小體量但多次數的重復任務,通過更精确的任務分配,讓每個線程都發揮出最大的性能,同時利用指令集特性快速分配任務線程,提高整個系統的運行效率。
圖源:intel
正是基于這個特性,Piuma 才能夠做到八核五百二十八線程的超級多線程設計,雖然單線程的處理性能遠低于 x86 架構處理器,但是卻可以滿足多并發的任務需求。随着人工智能等市場需求的增長,阿裡的平頭哥等企業都在基于 RISC-V 架構打造對應的多并發處理器,如今已經活躍于各個領網域。
随着 ChatGPT 等 AI 大模型成為主流趨勢,以 RISC-V 架構打造的處理器更符合 AI 大模型的實際運行場景,大量的短字節文字信息在常規的數據中心裡處理會浪費大量的算力,而在以 RISC-V 處理器為核心搭建的數據中心裡,短字節數據可以被精準分配到各個線程中處理,顯著提升處理效率。
不過,想要打造出英特爾計劃中的超大處理器集群,還有許多問題需要解決,目前英特爾的 Piuma 芯片在實際使用時,光纖的帶寬只有理論帶寬的一半,而且因為光纖發熱問題,導致在實際使用中故障頻發,需要經常檢查和更換光纖連接線,以至于英特爾目前最多也只是将兩顆 Piuma 芯片進行連接而已。
圖源:intel
可以說,在光纖材料的難題解決之前,英特爾設想的超大處理器集群都還只停留在 PPT 上,但是,如果可以解決材料問題,我們将可以創造出更契合 AI 大模型的伺服器集群。
End