今天小編分享的科技經驗:這家成立不到一年的小公司,怎麼就成了OpenAI的死敵?,歡迎閲讀。
大夥兒聽説了嗎, OpenAI 的勁敵又有新動作了。
就在前兩天, Mistral AI ( 下稱 Mistral )接連曝出了好幾個重磅消息,省流版就是:Mistral 抱上了微軟的大腿,還發布了類 ChatGPT 的聊天機器人,以及号稱能跟GPT-4 媲美的大模型。
這一下,給原本就不平靜的 AI 圈又澆了桶油。
在創始人之一 Guillaume Lample 的最新推文下面, Lecun 、 Jim Fan 等一眾圈内人紛紛前來祝賀。
國内媒體也不忘湊熱鬧,什麼下一個 OpenAI 要來了、 " 渣男 " 微軟腳踏兩只船、 OpenAI 成 " 備胎 " 的論調滿天飛,大有 Mistral 要把 OpenAI 的風頭給搶了去的意思。
可能有差友對 Mistral 并不熟悉,世超先給大夥兒介紹介紹這家 AI 獨角獸、開源大模型圈新晉王者的故事。
事實上去年這時候, Mistral 的三位核心創始人,還在為各自的實驗室打工。
Arthur Mensch ( 中 )在 DeepMind 搞大模型,另外的 Timoth é e Lacroix ( 右 )和 Guillaume Lample ( 左 )則是在 Meta 的巴黎 AI 實驗室。
至于離職的原因, Mensch 的説法是 " 不想在一個開發不透明( 閉源 )技術的大型科技公司工作 " ,而 Lacroix 和 Lample 也因為不想卷入公司内部的算力 " 鬥争 " ,收拾包袱離開了 Meta 。
在機緣巧合下,年齡相仿又曾經是校友的三人,聯手在法國創辦了 Mistral ,為的就是要搞出個歐洲人自己的、真正 Open 的 " OpenAI " 。
可能是創始人自帶履歷光環,也有可能是因為歐洲的 AI" 獨苗苗 " , Mistral 在還沒有像樣模型的時候,就拿到了 1 億多美元的種子輪融資。
" 4 周, 7 頁 PPT , 1.13 億美元融資 " 這幾個關鍵詞,也迅速傳遍 AI 圈。
結果開發者們一用,發現雖然只有 70 億參數量,但性能并不比 130 億參數的 Llama 2 弱多少,而且微調一下,在一張顯卡上就能運行,這在當時直接引爆了整個開源社區。
但這還沒完,很快, Mistral 又祭出了首個 MoE 開源模型 Mixtral 8x7B 。
這個 Mixtral 8x7B ,相當于有 8 個擅長不同領網域的專家,而模型會選出其中最符合的 2 個,幫咱解決問題。這種方法,既能快速準确地完成任務,又能減少模型的推理成本。
在 Mistral 發布的基準測試對比中, Mixtral 8x7B 的性能不輸 700 億參數版本 LLaMA 2 ,而且還追平了 GPT-3.5 。
從 Mistral 7B 到 Mixtral 8x7B 的發布, Mistral 只花了三個月,而這三個月, Mistral 的估值也一路狂飙,暴漲到了 20 億美元。
更重要的是, Mistral 在整個圈子裏還帶起來了一股 " 小 " 模型的風潮。
以前都説,參數量越大模型性能就越好,但堆參數量,你算力也得跟上才行。大公司們财大氣粗耗得起,但小企業個人開發者可吃不消。
而且把大模型塞進手機、汽車這些智能設備裏本地運行,也成了目前比較火的方向,這也要求大模型得 " 小而美 " 才行。
于是乎在 Mistral 7B 之後,微軟也整出了 27 億參數的 Phi-2 ,面壁智能整出了 20 億參數的 " 小鋼炮 " MiniCPM ,包括幾天前,谷歌也開源了 20 億和 70 億參數的 Gemma 模型。
但 Mistral 的上分之路,還遠沒有結束。
這次, Mistral 又帶來了号稱能跟 GPT-4 單挑的 Mistral Large 。
根據官方的説法, Mistral Large 的性能不輸 GPT-4 和 Gemini Pro ,但訓練成本卻只有大約 2200 萬美元,可能是 GPT-4 的五分之一。
不過有人發現,向來堅定開源的 Mistral 這次竟然不公開 Mistral Large 的代碼了。
而且, Mistral 官網還把之前有關開源社區義務的内容給删了。
這一舉一動,不免讓人猜測:Mistral 是不是要走 OpenAI 的老路了。
就連馬斯克,也忍不住在 X 上嘴了一句:是微軟讓他們這麼幹的?
但 Mistral Large 和 Mistral Small 幾個模型,的确沒有開放代碼, " 閉源 " 的事兒算是坐實了。
為了安撫開發者們的情緒, Mistral 的 CEO 也出來公關了一把:團隊未來依然會堅持開源理念,同時也會推出更強大的閉源模型參與商業競争。
相當于兩條腿走路,小參數規模的模型( Mistral 7B 和 Mixtral 8x7B )繼續開源, " 大中小杯 " 則是閉源去跟 OpenAI 這些個大廠 battle。
這事兒免不了落人話柄,但世超覺得,把 Mistral 閉源的鍋全甩給微軟,也不太地道。
説到底, Mistral 還是家初創公司,微軟要算力有算力,要錢有錢,而 Mistral 的模型表現有目共睹,放到微軟的 Azure 上,也是筆生意。
另外對已經重注了 OpenAI 的微軟來説,雞蛋,總不能只放 OpenAI 這一個籃子裏吧。
大夥們别忘了, Meta 和微軟在 AI 領網域的合作也相當密切,當年的 Llama 2 ,就是 Meta 和微軟聯合發布。
而最後,無論是 OpenAI 所代表的閉源大模型占優,還是 LlaMA 為代表的開源陣營獲勝,目前全球市值第一的微軟,似乎都是最後的赢家。
再結合一下這次和 Mistral 的合作,世超只想説,目前的世界的 AI 格局其實很簡單,那就是:收手吧 AI 巨頭們,外面都是微軟。