今天小編分享的科技經驗:歐洲最火AI獨角獸發布旗艦大模型,性能直逼GPT-4,微軟宣布合作投資,歡迎閱讀。
在 MMLU 基準測評中,Mistral Large 成為僅次于 GPT-4 且可通過 API 普遍使用的模型。
智東西 2 月 27 日消息,昨天,歐洲生成式 AI 獨角獸 Mistral AI 發布最新旗艦大語言模型 Mistral Large。據外媒 The Verge 報道,與 Mistral AI 之前的模型不同,Mistral Large 不會開源。
該模型上下文視窗為 32K tokens,支持英語、法語、西班牙語、德語和意大利語,Mistral AI 未公布其具體參數規模。
Mistral AI 亮出了多份基準測評成績單。其中,在衡量多語言理解任務基準 MMLU 上,Mistral Large 的表現僅次于 GPT-4;在多語言能力的基準測評對比中,Mistral Large 的表現優于 70B 參數規模的 Llama 2。此前,Mistral AI 就用 70 億參數大模型 Mistral-7B 成功挑戰 Llama 2 一度爆紅。
在定價方面,Mistral Large 的定價略低于 GPT-4 Turbo。Mistral Large 為輸入0.008 美元/1000tokens,GPT-4 Turbo 為0.01 美元/1000tokens,輸出 Mistral Large 是0.024 美元/1000tokens,GPT-4 Turbo 為0.03 美元/1000tokens。
與此同時,在 Mistral AI 新模型發布當天,微軟官宣與 Mistral AI 達成多年合作夥伴關系,并且據英國《金融時報》報道,微軟還對 Mistral 進行了小額投資,但不持有該公司任何股權。
此次合作使得 Mistral AI 可以在微軟的 Azure 雲計算平台上提供其大模型,這家公司也成為繼 OpenAI 之後第二家在該平台上托管大模型的公司。
01. 亮出四大新功能,多語言能力測試優于 Llama 2
在官方博客中提到,Mistral Large 具有四大新功能及優勢:
首先,Mistral Large 支持英語、法語、西班牙語、德語和意大利語,并對相應語法和文化背景有更深入的理解。
其次,該模型支持32K tokens上下文視窗。
第三,Mistral Large 基于精确的指令遵循,使得開發人員能夠設計他們的審核策略,并且 Mistral 使用這一指令設定了會話助手 le Chat 的系統級審核。
最後,這一模型本身能夠進行函數調用。這與在 la Plateforme 平台上實行的約束輸出模式(constrained output mode),可以實現大規模應用程式開發和技術堆棧的現代化。
Mistral AI 公布了 Mistral Large 與其他大語言模型在多項基準測評任務中的對比:
其中,在測量多語言理解任務基準 MMLU 上,Mistral Large 的表現優于 Claude 2、Gemini Pro 1.0、GPT-3.5 和 LLaMA 2 70B,成為僅次于 GPT-4 且可通過 API 普遍使用的模型。
推理和知識能力的基準測評對比:
多語言能力的基準測評對比:
Mistral Large 在法語、德語、西班牙語和意大利語的基準測試中明顯優于 LLaMA 2 70B。
數學與代碼能力測評對比:
此外,Mistral AI 還發布了新的對話助手 le Chat,le Chat 可以作為用戶與 Mistral AI 所有模型進行互動的對話入口。面向企業的助手為 le Chat Enterprise,該助手可以通過自我部署功能和細粒度的審核機制來提高團隊的生產力。
le Chat 沒有接入互聯網,因此官方博客也提到,該助手可能會使用過時的信息進行回答。目前,用戶可以通過加入等候列表名單,以等待使用 le Chat。
le Chat 體驗地址:https://chat.mistral.ai/chat
02. 發布全新 Mistral Small,優化響應延遲、成本
除發布新 Mistral Large 旗艦模型外,Mistral AI 還将Mistral Small針對延遲和成本進行了優化。
Mistral Small 的性能優于 Mixtral 8x7B,并且延遲較低,這使其成為該公司的開源重量級產品和旗艦型号之間的 " 精致 " 中間解決方案。
目前,該公司正在簡化其端點產品以提供以下内容:
包括 open-mistral-7B 和 open-mixtral-8x7b 在内,具有競争性定價的開放權重端點。
新的優化模型端點,涵蓋 mistral-small-2402 以及 mistral-large-2402。
面向開發者,mistral-small 和 mistral-large 支持函數調用和 JSON 格式,其中 JSON 格式模式強制大語言模型輸出為有效的 JSON,此功能使開發人員能夠更自然地與模型進行互動,以結構化格式提取信息,以便在其流水線的其餘部分中輕松使用。
函數調用使開發人員可以使用一組自己的工具連接 Mistral AI 端點,從而實現與内部代碼、API 或數據庫的更復雜互動。
Mistral AI 的博客中透露,該公司将很快向所有端點添加格式,并啟用更細粒度的格式定義。
03. 與微軟達成長期合作關系,圍繞三大重點開展合作
昨天,微軟宣布與 Mistral AI 達成多年合作夥伴關系。因此,Mistral AI 的模型目前可以通過三種方式獲得,除了建立在 Mistral AI 自己基礎設施之上的La Plateforme、企業私有部署外,還可以在微軟雲上使用。
微軟的官方博客提到,微軟與 Mistral AI 的合作重點主要圍繞着超級計算基礎設施、為 Mistral AI 的模型開拓市場以及 AI 研究和開發。
首先在超級計算基礎設施方面,微軟将通過 Azure AI 超級計算基礎設施來支持 Mistral AI,支持其旗艦模型的 AI 訓練和推理。
其次,微軟和 Mistral AI 将通過Azure AI Studio 和 Azure 機器學習模型目錄中的模型即服務(MaaS)向客戶提供 Mistral AI 的高級模型。
最後,兩家公司還将探索圍繞為歐洲公共部門等特定客戶訓練特定目的模型的合作。
04. 結語:Mistral AI 商業化探索加快
此前,Mistral AI 就憑借創新的技術路線,以 70 億參數打敗了數百億參數的開源大語言模型霸主 Llama 2。
Mistral AI 的模型通常是開源的,但此次模型閉源再加上與微軟的長期合作,或許意味着這家法國創企可以探索更多的商業機會。