今天小編分享的互聯網經驗:Meta聯手微軟挑戰大模型格局,最新Llama 2免費開源,可直接商用,歡迎閲讀。
(圖片來源:Meta 官網)
一夜之間,人工智能(AI)大模型格局再次發生巨變。
钛媒體 App 獲悉,北京時間 7 月 19 日凌晨,市值近 8000 億美元的科技巨頭 Meta(原 Facebook,NASDAQ: META)發布最新 AI 大語言模型 Llama 2 系列,包含 70 億、130 億和 700 億三種參數版本,模型信息和起始代碼全部開源,并支持免費可商用,還包含針對會話聊天場景微調的 Llama 2-CHAT 模型版本。
相較于今年 2 月發布的 Llama 1,最新 Llama 2 訓練所用的 token 翻了一倍至 2 萬億。Meta 表示,在包括推理、編碼、精通性和知識測試等多個外部基準評分測評中,Llama 2 表現優于所有開源的 Chat 模型。
同時,Meta 今晨還宣布與微軟、高通公司展開合作,Llama 2 将部署在微軟雲服務 Azure 上,同時 Llama 2 将能在高通芯片上運行,打破市場上英偉達、AMD 處理器對 AI 算力市場的壟斷。
" 微軟是我們 Llama 2 的首選合作夥伴,并擴大我們在生成式人工智能(AIGC)方面的努力。"Meta 認為,開放的方法對于當今 AI 模型開發是正确的,特别是那些在技術快速發展的大模型。公司還在論文中稱,根據 Meta 對有用性和安全性的人工評估,Llama 2 可能是封閉模型的合适替代產品。
微軟 CEO 納德拉(Satya Nadella)和 Meta CEO 扎克伯格(來源:扎克伯格 ins)
2018 年圖靈獎得主、Meta 首席 AI 科學家楊立昆(Yann LeCun)則發布推文直言," 這将會改變大型語言模型(LLM)市場的格局。"
Meta 挑戰 OpenAI:Chat 性能更強、更安全,整體接近 GPT-3.5
十多年來,Meta 不僅玩 " 元宇宙 ",而且一直有一個 AI 技術研究的布局,尤其它的 instagram、Facebook 等社交產品急需算法帶來廣告支持。
今年 2 月,Meta 發布了 AI 大模型 Llama 1。公司稱,研究人員對 Llama 1 的巨大需求震驚了,有超過 10 萬條訪問請求,而且更多開發者通過在 Llama 上面構建模型應用,并取得的驚人成就。不過,Llama 因為開源協定問題,一直不可免費商用。
時隔五個月後,當地時間 7 月 18 日,Meta 發布開源大模型 Llama 2,不僅可免費商用,而且公布了一份論文式技術報告,全面展示了 Llama 2 的技術能力和評測信息。
(注:論文地址:https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/ ;項目地址:https://github.com/facebookresearch/llama)
據悉,Llama 2 是 Llama 1 的更新版本。相比于 Llama 1,Llama 2 的預訓練模型是在 2 萬億 token(文本數據部門)上訓練的,比 Llama 1 數據大小多了 40%(增加 1.4 倍),上下文長度也翻倍,并采用了分組查詢注意力(GQA)機制,而精調 Chat 模型是在 100 萬人類标記數據上訓練的。
在技術上,新的 Llama 2 使用了優化的自回歸 Transformer 框架,當然也支持 PyTorch,執行了更穩健的數據清理,更新了混合數據。
目前,Llama 2 的系列模型有 7B、13B 和 70B 三種。而且 Meta AI 表示他們還在訓練 34B 的版本,但暫時不會對外發布。而 Meta 的精調版大模型LLAMA 2-chat,是基于 LLAMA 2 針對對話場景微調的版本,同樣支持 7B、13B 和 70B 參數三個版本,使用 RLHF、監督微調 ( SFT ) 等技術對模型進行迭代優化。
根據 Meta 展示的多個評測信息,截至目前,Llama 2 70B 的性能表現更加接近 GPT-3.5,與谷歌 PaLM ( 540B ) 持平或表現更好,但 Meta 也承認 Llama 2 距離 GPT-4 和谷歌 PaLM-2-L 等領先非開源模型的性能仍存在較大差距。
Alpaca 研究團隊的斯坦福基礎模型研究中心主任 Percy Liang 表示," 但對于很多場景,你并不需要 GPT-4。"
此外,論文還提及了 Llama 2 在安全性上的努力。其中 Meta 在安全微調中使用了監督安全微調、安全 RLHF、安全上下文蒸餾等技術,而且使用三個常用基準評估了 Llama 2 的安全性,整體良好,比其他大型語言模型更加穩定、更佳安全。
微軟 " 腳踩兩只船 ":不僅聯姻 Meta,而且對 GPT 版 office 漲價
引領這一輪 AI 浪潮的微軟,在今天全球合作夥伴大會(Inspire 2023)上終于亮出新戰略。
當地時間 7 月 18 日,Meta 和微軟聯合宣布,自今天開始,Meta 公司的 Llama 2 将在微軟的 Azure 和 Windows 平台上線。
微軟 CEO 納德拉表示,Llama 2 可以讓 Microsoft Azure 的開發人員能夠使用它進行構建,并利用他們的雲原生工具進行内容過濾和安全功能。它還經過優化,可以在 Windows 上本地運行,為開發人員提供無縫的工作流程。
Meta 公司表示,Llama 2 将在微軟的 Azure 雲上線,後續将在亞馬遜 AWS 和 Hugging Face 等其他平台上分發,向全球開發者首發基于 Llama 2 模型的雲服務。
微軟 CEO 納德拉(Satya Nadella)
所以,目前在微軟的開發平台上擁有兩個大模型選項:不僅擁有 OpenAI 的 GPT 系列大模型,而且還有 Meta 的 Llama 2 大模型。
同時,微軟周二還宣布,面向 Office 365 E3、E5、商業标準版和商業進階版的訂閲商户,微軟 Microsoft 365 Copilot 将統一定價為每個用户每月 30 美元。根據官網定價,這些面向企業用户的訂閲服務,收費标準從每個用户 12.5 美元至 38 美元 / 月不等,這意味着微軟把商業用户 Office 服務的定價提升了 1-3 倍。
微軟企業副總裁兼消費領網域首席營銷官 Yusuf Mehdi 表示,在過去幾個月裏,全球已經有 600 家公司已經參與了該產品的搶先體驗計劃,其中就有畢馬威、阿聯酋國家發展銀行等知名機構。他強調,使用 Copilot 的客户越多,他們對 Copilot 的熱情就越高。很快,沒人會願意在沒有它的情況下工作了。
這足以顯現微軟與 OpenAI 實現 Office AI 產品,對于市場的定價權和吸引力。
微軟曾透露,截至 2023 年第一季度,全球總共有 3.82 億人正在使用商業版本的 Microsoft(Office)365 軟體。
不過,微軟今天并沒有公布該產品正式上線的日期。除微軟,谷歌也曾在今年早些時候宣布将把 AI 功能集成到雲辦公套件 Google Workspace 裏。包括 Zoom 等細分行業的互聯網軟體服務商也在抓緊上架 AI 功能。
值得注意的是,芯片巨頭高通今晨聯合宣布,計劃從 2024 年起,在旗艦智能手機和 PC 上支持基于 Meta Llama 2 的 AI 部署,賦能開發者使用骁龍平台的 AI 能力,推出全新生成式 AI 應用。
微軟股價日線圖(來源:TradingView)
受新消息影響,截至美股周二,微軟股價收漲 3.98%,創出歷史新高。2023 年至今,微軟累計漲幅達 50.05%。
(本文首發钛媒體 App,作者|林志佳)
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App