3140參數Grok-1推理加速3.8倍，PyTorch+HuggingFace版來了 - 大酷樂

今天小編分享的科學經驗：3140參數Grok-1推理加速3.8倍，PyTorch+HuggingFace版來了，歡迎閲讀。

馬斯克説到做到開源 Grok-1，開源社區一片狂喜。

但基于 Grok-1 做改動 or 商用，都還有點難題：

Grok-1 使用Rust+JAX 構建，對于習慣 Python+PyTorch+HuggingFace 等主流軟體生态的用户上手門檻高。

△圖注：Grok 登上 GitHub 熱度榜世界第一

Colossal-AI 團隊最新成果，解大家燃眉之急，提供方便易用的 Python+PyTorch+HuggingFace Grok-1，能将推理時延加速近 4 倍！

現在，模型已在 HuggingFace、ModelScope 上發布。

性能優化

結合 Colossal-AI 在 AI 大模型系統優化領網域的豐富積累，已迅速支持對 Grok-1 的張量并行。

在單台 8H800 80GB 伺服器上，推理性能相比 JAX、HuggingFace 的 auto device map 等方法，推理時延加速近 4 倍。

使用教程

./run_inference_fast.sh hpcaitech/grok-1

更多詳情可參考 grok-1 使用例：

https://github.com/hpcaitech/ColossalAI/tree/main/examples/language/grok-1

龐然大物 Grok-1

此次開源，xAI 發布了 Grok-1 的基本模型權重和網絡架構。

具體來説是 2023 年 10 月預訓練階段的原始基礎模型，沒有針對任何特定應用（例如對話）進行微調。

結構上，Grok-1 采用了混合專家（MoE）架構，包含 8 個專家，總參數量為 314B（3140 億），處理 Token 時，其中的兩個專家會被激活，激活參數量為 86B。

單看這激活的參數量，就已經超過了密集模型 Llama 2 的 70B，對于 MoE 架構來説，這樣的參數量稱之為龐然大物也毫不為過。

更多參數信息如下：

視窗長度為 8192tokens，精度為 bf16

Tokenizer vocab 大小為 131072（2^17），與 GPT-4 接近；

embedding 大小為 6144（48 × 128）；

Transformer 層數為 64，每層都有一個解碼器層，包含多頭注意力塊和密集塊；

key value 大小為 128；

多頭注意力塊中，有 48 個頭用于查詢，8 個用于 KV，KV 大小為 128；

密集塊（密集前饋塊）擴展因子為 8，隐藏層大小為 32768

在 GitHub 頁面中，官方提示，由于模型規模較大（314B 參數），需要有足夠 GPU 和内存的機器才能運行 Grok。

這裏 MoE 層的實現效率并不高，選擇這種實現方式是為了避免驗證模型的正确性時需要自定義内核。

模型的權重檔案則是以磁力鏈接的形式提供，檔案大小接近 300GB。

值得一提的是，Grok-1 采用的是 Apache 2.0 license，商用友好。

目前 Grok-1 在 GitHub 上的标星已達到 43.9k Stars。

量子位了解，Colossal-AI 将在近期進一步推出對 Grok-1 在并行加速、量化降低顯存成本等優化，歡迎持續關注。

Colossal-AI 開源地址：

https://github.com/hpcaitech/ColossalAI

熱門排行

高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
曹操墓，裏面都有啥？衛青柏 | 2023-05-02
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
解除資格！停止一切合作佼昌翰 | 2023-05-02
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
200户連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容温柔郜萌運 | 2023-05-02