Meta“搞大事”了：發布GPT“平替”Llama 2，開源、免費、還可商用！

今天小編分享的互聯網經驗：Meta“搞大事”了：發布GPT“平替”Llama 2，開源、免費、還可商用！，歡迎閱讀。

Meta 最近 " 殺紅眼 " 了。

在上周 Meta 推出 Threads 對戰 Twitter、以史上最快速度突破 1 億用戶之後，今天，Meta 又在大語言模型方面和微軟強強聯手，向谷歌和 OpenAI 發起了新的挑戰。

在今天的微軟的 Inspire 合作夥伴大會上，Meta 宣布和微軟深化合作，正式推出新一代開源大型語言模型 Llama 2，并将該模型免費開放給商業和研究使用。

此次 Meta 高調開源 Llama 2，無疑是在正面硬剛走 " 技術保密路線 " 的 GPT-4 和谷歌的 PaLM 2。扎克伯格在 Facebook 上發帖表示："Meta 有着悠久的開源歷史，開源推動創新，它讓更多開發人員能夠使用新技術進行開發，同時提高了技術的安全性。我們相信如果生态系統更加開放，将會帶來更多進步，這就是我們開源 Llama 2 的原因。"

面對 OpenAI 和谷歌正在努力構建的技術圍牆，Meta 似乎想要另辟蹊徑、通過生态開放來切入這場巨頭間的大模型競賽。

模型更新 + 開源可商用，Meta 拿出 LLaMA2 " 大殺器 "

今年 2 月，Meta 首次發布了自家的大語言模型 LLaMA（Large Language Model Meta AI）系列，包含 70 億、130 億、330 億和 650 億 4 個版本。

當時 Meta 表示 LLaMA 擁有超高性能，使用 130 億參數的 LLaMA 在規模僅為 ChatGPT 的十分之一的情況下，性能表現可以優于 GPT-3。使用 650 億參數的 LLaMA 則可以與 DeepMind700 億參數的 Chinchilla 模型和谷歌 5400 億參數的 PaLM 模型比肩。

LLaMA 模型表現，圖片來自 Meta

但 2 月版本的 LLaMA 并不是 ChatGPT 的直接競争對手，LLaMA 定位于 " 開源的研究工具 "，所使用的是各類公開可用的數據集。它當時更多的着眼于研究領網域，僅在非商業許可下提供給政府、社區和學術界的研究人員。

值得注意的是，LLaMA 發布後還出現了一個 " 洩露風波 "，從而在業界推動了一波 GPT 平替風潮。雖然當時 Meta 稱 LLaMA 是開源的，但研究人員仍然需要向 Meta 提出申請和審核。但就 LLaMA 發布不久後，其模型源代碼的檔案卻在技術論壇上瘋傳，直接助推了包括斯坦福大學 Alpaca、加州大學伯克利分校 ColossalChat 等基于 LLaMA 構建的語言模型和產品的出現。

當時因為洩漏的種子檔案還被一度合并到了 Meta Research 官方 GitHub 上，并得到了一些項目維護者的批準，也有人猜測 LLaMA 的洩露是 Meta 有意為之，其目的就是為了日後的商業化做鋪墊。

但不論此前 LLaMA 的洩露是否是 Meta 的試水之舉，今天，Llama 2 正式開啟了開源商用版本。

根據 Meta 的官方數據，Llama 2 相較于上一代其訓練數據提升了 40%，包含了 70 億、130 億和 700 億參數 3 個版本。Llama 2 預訓練模型接受了 2 萬億個 tokens 的訓練，上下文長度是 Llama 1 的兩倍，其微調模型已經接受了超過 100 萬個人類注釋的訓練。

在訓練流程方面，跟 ChatGPT 類似，Llama 2 也經歷了預訓練階段（PT）、指令微調（SFT）以及人類反饋強化學習（RLHF）三個階段。在包括推理、編碼、熟練程度和知識測試等外部基準測試中，Llama 2 在許多方面都顯著高于 MMLU、TriviaQA 等其他開源語言模型。

Meta 表示 Llama 2 可免費用于研究和商業用途，開發者們可以直接在 Llama 2 官方網站下下載該模型。為了避免此前 LLaMA 洩漏後帶來的深度偽造和色情聊天機器人等不良信息和產品的出現，Llama 2 已經經過了紅隊測試，避免模型產出不良和有害内容，并且為開發者們制定了使用指南和守則。

圖片來自 MetaMeta 搞免費開源，攪動大模型池水

Meta 發布首個開源可商用大語言模型的消息，無疑是在行業内釋放了一個重磅炸彈。

用 Yann LeCun 的話來說，Meta 此舉可能将就此改變大模型行業的競争格局。

眾所周知，OpenAI 和 Google 目前是大語言模型領網域中的兩大霸主，但他們在最新、最先進的模型上都選擇了 " 閉源 "，OpenAI 目前只是以 API 付費的方式向開發者提供服務。而此次，Meta 在性能上足以比肩 GPT-3.5 的 Llama 2 免費開放給所有人，這肯定會吸引大量的開發者和創業者使用抛棄 OpenAI 和谷歌轉向 Llama 2。

對于 Meta 來說，在 AI 用戶争奪戰上的落後讓它不能再和 OpenAI、谷歌一樣走非開源語言模型路線，開放生态則是目前一個很好的切入點。開源之後，Meta 将擁有更多的可訓練數據，開發人員能夠幫助 Llama 2 去發現和解決漏洞，并且能夠很快打開市場，為未來的商業化鋪路。一定程度上來說，Meta 此次也是在反向施壓 OpenAI 和谷歌。

此次，為了鼓勵更多開發者加入 Llama 生态，Meta 還開放了人工智能研究社區和 Llama 影響力挑戰賽，鼓勵開發者們基于 Llama 2 來進行創建、交流和讨論，并進一步解決環境、教育和其他公共領網域的問題。

除了 Meta 官方以及合作夥伴微軟之外，Llama 2 還可以通過亞馬遜 AWS、Hugging Face 和其他提供商獲取。

" 雙 M" 聯盟走向深化，微軟或成最大赢家？

除了 Llama 此次的開源、商業特點之外，Meta 和微軟（Microsoft）的聯盟也尤其引人注目。

Meta 和微軟向來關系不錯，此前 Meta 搞元宇宙時，納德拉就為其站台并且率先帶着微軟的一眾產品進入 Meta 的 VR 平台。在 AI 領網域，兩家巨頭也有着長期的合作歷史。從 2017 年兩家共同推出了可互換人工智能框架的開放生态系統，到 ONNX Runtime 與 PyTorch 的集成等，Azure 一直都是 Meta 的雲業務上的戰略合作夥伴。

圖片來自扎克伯格 Instagram

此次，兩家就 Llama 2 進行了更加深入、全面的合作。微軟表示，Llama 2 将在 Azure AI 模型目錄中提供，使得使用 Microsoft Azure 的開發者能夠構建并使用 Llama 2，同時利用他們的雲原生工具進行内容過濾和安全功能。Llama 2 也已優化為可在 Windows 本地運行，為開發者提供無縫的工作流，将更廣泛地提供給企業并可由企業定制。

值得注意的是，Meta 和微軟也是今年以來股價漲幅最大的科技巨頭之一，Meta 今年上漲了 154%，微軟上漲了 48%。

總體來看，一邊抓着 OpenAI 閉門研究、探索商業化變現，另一邊跟 Meta 聯合搞開源生态，微軟或許是此次 AI 熱潮中最得意的人。

那麼，你對于 Meta 這一次的商業版大模型開源怎麼看，你們認為 Meta 此舉會引發行業内的開源熱潮嗎？歡迎大家留言讨論！

注：封面圖來自于 Meta，版權屬于原作者。如果不同意使用，請盡快聯系我們，我們會立即删除。