今天小編分享的互聯網經驗:Meta“搞大事”了:發布GPT“平替”Llama 2,開源、免費、還可商用!,歡迎閱讀。
Meta 最近 " 殺紅眼 " 了。
在上周 Meta 推出 Threads 對戰 Twitter、以史上最快速度突破 1 億用戶之後,今天,Meta 又在大語言模型方面和微軟強強聯手,向谷歌和 OpenAI 發起了新的挑戰。
在今天的微軟的 Inspire 合作夥伴大會上,Meta 宣布和微軟深化合作,正式推出新一代開源大型語言模型 Llama 2,并将該模型免費開放給商業和研究使用。
此次 Meta 高調開源 Llama 2,無疑是在正面硬剛走 " 技術保密路線 " 的 GPT-4 和谷歌的 PaLM 2。扎克伯格在 Facebook 上發帖表示:"Meta 有着悠久的開源歷史,開源推動創新,它讓更多開發人員能夠使用新技術進行開發,同時提高了技術的安全性。我們相信如果生态系統更加開放,将會帶來更多進步,這就是我們開源 Llama 2 的原因。"
面對 OpenAI 和谷歌正在努力構建的技術圍牆,Meta 似乎想要另辟蹊徑、通過生态開放來切入這場巨頭間的大模型競賽。
模型更新 + 開源可商用,Meta 拿出 LLaMA2 " 大殺器 "
今年 2 月,Meta 首次發布了自家的大語言模型 LLaMA(Large Language Model Meta AI)系列,包含 70 億、130 億、330 億 和 650 億 4 個版本。
當時 Meta 表示 LLaMA 擁有超高性能,使用 130 億參數的 LLaMA 在規模僅為 ChatGPT 的十分之一的情況下,性能表現可以優于 GPT-3。使用 650 億參數的 LLaMA 則可以與 DeepMind700 億參數的 Chinchilla 模型和谷歌 5400 億參數的 PaLM 模型比肩。
LLaMA 模型表現,圖片來自 Meta
但 2 月版本的 LLaMA 并不是 ChatGPT 的直接競争對手,LLaMA 定位于 " 開源的研究工具 ",所使用的是各類公開可用的數據集。它當時更多的着眼于研究領網域,僅在非商業許可下提供給政府、社區和學術界的研究人員。
值得注意的是,LLaMA 發布後還出現了一個 " 洩露風波 ",從而在業界推動了一波 GPT 平替風潮。雖然當時 Meta 稱 LLaMA 是開源的,但研究人員仍然需要向 Meta 提出申請和審核。但就 LLaMA 發布不久後,其模型源代碼的檔案卻在技術論壇上瘋傳,直接助推了包括斯坦福大學 Alpaca、加州大學伯克利分校 ColossalChat 等基于 LLaMA 構建的語言模型和產品的出現。
當時因為洩漏的種子檔案還被一度合并到了 Meta Research 官方 GitHub 上,并得到了一些項目維護者的批準,也有人猜測 LLaMA 的洩露是 Meta 有意為之,其目的就是為了日後的商業化做鋪墊。
但不論此前 LLaMA 的洩露是否是 Meta 的試水之舉,今天,Llama 2 正式開啟了開源商用版本。
根據 Meta 的官方數據,Llama 2 相較于上一代其訓練數據提升了 40%,包含了 70 億、130 億和 700 億參數 3 個版本。Llama 2 預訓練模型接受了 2 萬億個 tokens 的訓練,上下文長度是 Llama 1 的兩倍,其微調模型已經接受了超過 100 萬個人類注釋的訓練。
在訓練流程方面,跟 ChatGPT 類似,Llama 2 也經歷了預訓練階段(PT)、指令微調(SFT)以及人類反饋強化學習(RLHF)三個階段。在包括推理、編碼、熟練程度和知識測試等外部基準測試中,Llama 2 在許多方面都顯著高于 MMLU、TriviaQA 等其他開源語言模型。
Meta 表示 Llama 2 可免費用于研究和商業用途,開發者們可以直接在 Llama 2 官方網站下下載該模型。為了避免此前 LLaMA 洩漏後帶來的深度偽造和色情聊天機器人等不良信息和產品的出現,Llama 2 已經經過了紅隊測試,避免模型產出不良和有害内容,并且為開發者們制定了使用指南和守則。
圖片來自 MetaMeta 搞免費開源,攪動大模型池水
Meta 發布首個開源可商用大語言模型的消息,無疑是在行業内釋放了一個重磅炸彈。
用 Yann LeCun 的話來說,Meta 此舉可能将就此改變大模型行業的競争格局。
眾所周知,OpenAI 和 Google 目前是大語言模型領網域中的兩大霸主,但他們在最新、最先進的模型上都選擇了 " 閉源 ",OpenAI 目前只是以 API 付費的方式向開發者提供服務。而此次,Meta 在性能上足以比肩 GPT-3.5 的 Llama 2 免費開放給所有人,這肯定會吸引大量的開發者和創業者使用抛棄 OpenAI 和谷歌轉向 Llama 2。
對于 Meta 來說,在 AI 用戶争奪戰上的落後讓它不能再和 OpenAI、谷歌一樣走非開源語言模型路線,開放生态則是目前一個很好的切入點。開源之後,Meta 将擁有更多的可訓練數據,開發人員能夠幫助 Llama 2 去發現和解決漏洞,并且能夠很快打開市場,為未來的商業化鋪路。一定程度上來說,Meta 此次也是在反向施壓 OpenAI 和谷歌。
此次,為了鼓勵更多開發者加入 Llama 生态,Meta 還開放了人工智能研究社區和 Llama 影響力挑戰賽,鼓勵開發者們基于 Llama 2 來進行創建、交流和讨論,并進一步解決環境、教育和其他公共領網域的問題。
除了 Meta 官方以及合作夥伴微軟之外,Llama 2 還可以通過亞馬遜 AWS、Hugging Face 和其他提供商獲取。
" 雙 M" 聯盟走向深化,微軟或成最大赢家?
除了 Llama 此次的開源、商業特點之外,Meta 和微軟(Microsoft)的聯盟也尤其引人注目。
Meta 和微軟向來關系不錯,此前 Meta 搞元宇宙時,納德拉就為其站台并且率先帶着微軟的一眾產品進入 Meta 的 VR 平台。在 AI 領網域,兩家巨頭也有着長期的合作歷史。從 2017 年兩家共同推出了可互換人工智能框架的開放生态系統,到 ONNX Runtime 與 PyTorch 的集成等,Azure 一直都是 Meta 的雲業務上的戰略合作夥伴。
圖片來自扎克伯格 Instagram
此次,兩家就 Llama 2 進行了更加深入、全面的合作。微軟表示,Llama 2 将在 Azure AI 模型目錄中提供,使得使用 Microsoft Azure 的開發者能夠構建并使用 Llama 2,同時利用他們的雲原生工具進行内容過濾和安全功能。Llama 2 也已優化為可在 Windows 本地運行,為開發者提供無縫的工作流,将更廣泛地提供給企業并可由企業定制。
值得注意的是,Meta 和微軟也是今年以來股價漲幅最大的科技巨頭之一,Meta 今年上漲了 154%,微軟上漲了 48%。
總體來看,一邊抓着 OpenAI 閉門研究、探索商業化變現,另一邊跟 Meta 聯合搞開源生态,微軟或許是此次 AI 熱潮中最得意的人。
那麼,你對于 Meta 這一次的商業版大模型開源怎麼看,你們認為 Meta 此舉會引發行業内的開源熱潮嗎?歡迎大家留言讨論!
注:封面圖來自于 Meta,版權屬于原作者。如果不同意使用,請盡快聯系我們,我們會立即删除。