Mistral多模态大模型來了！120億參數，原生支持任意大小/數量影像，公司估值已達420億 - 大酷樂

今天小編分享的科學經驗：Mistral多模态大模型來了！120億參數，原生支持任意大小/數量影像，公司估值已達420億，歡迎閲讀。

Mistral 的多模态大模型來了！

Pixtral 12B正式發布，同時具備語言和視覺處理能力。

它建立在文本模型Nemo 12B基礎上，包含一個專門的視覺編碼器。

大概 24GB，原生支持任意數量和尺寸的影像，大約有 40 層神經網絡、14,336 個隐藏維度大小和 32 個注意力頭，以及一個專用的視覺編碼器，支持高分辨率影像（1024 × 1024）處理。

發布形式還是簡單直接一個種子鏈接。

Mistral 的開發主管表示，後續也會在 Chatbot 上接入模型，并提供 API 服務。

超越 Qwen、LLaVA 等

雖然目前模型的訓練數據、細節都未公開，但是通過模型代碼網友們發現了更多細節。

1、先進架構：40 層網絡、14336 隐藏維度大小、32 個注意力頭。

2、視覺能力：專用視覺編碼器，支持 1024x1024 影像大小和 24 個隐藏層，用于高級影像處理。

3、更大詞匯量：131072tokens，支持更細致語言理解和生成。

4、使用 GeLU ( 用于視覺适配器 ) 和 2D RoPE ( 用于視覺編碼器 ) 。

5、Patch 大小：16 × 16 像素。

6、在 mistral_common 中支持 tokenizer。

7、模型權重 bf16。

與此同時，還有人在放出了 Mistral 發布會上公布的模型基準情況。

Pixtral 12B 和 Qwen2-VL-7B、LLaVA-OV-7B、Phi-3 Vision 做了對比。

多模态知識和推理、QA 等方面都表現不錯。

歐洲版 OpenAI 估值達 60 億美元

最近幾個月 Mistral 的動作還是非常密集的。

今年 6 月，他們通過股權債務融資完成約 6.4 億美元 B 輪融資。估值已達 60 億美元（折合人民币約 420 億）。

完成融資後，他們便發布了 Mistral Large 2 旗艦模型、SMoE 模型 Mistral 8 × 22B 以及開源模型 Codestral 等。

目前，微軟、AWS、Snowflake 等巨頭均投資 Mistral。尤其是微軟的入股，使得 Mistral 成為 OpenAI 以外，微軟 Azure 第二個商業閉源模型供應商。這也進一步夯實了 Mistral" 歐洲版 OpenAI" 的地位。

參考鏈接：

[ 1 ] https://x.com/_philschmid/status/1833954941624615151

[ 2 ] https://venturebeat.com/ai/pixtral-12b-is-here-mistral-releases-its-first-ever-multimodal-ai-model/

[ 3 ] https://x.com/theresanaiforit/status/1833784474342977627

熱門排行

高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
曹操墓，裏面都有啥？衛青柏 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
解除資格！停止一切合作佼昌翰 | 2023-05-02
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
200户連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容温柔郜萌運 | 2023-05-02