今天小編分享的科技經驗:人稱“GPT-4最強平替”的Llama 2,究竟比ChatGPT厲害在哪裡?,歡迎閱讀。
智東西(公眾号:zhidxcom)
編譯 | 銘滟
編輯 | 徐珊
智東西 7 月 26 日消息,據 The Information 報道,Llama 2 與 GPT-4 在性能與成本方面各有優勢。除此之外,雖然 Llama 2 為免費商用的開源模型,但大模型的創建過程還需要專業人員操作。Llama 2 的發布也激發了 AI 愛好者的積極讨論與應用。
在性能方面,根據大規模多任務語言理解的基準測試,GPT-4 和 GPT-3.5 的表現均優于 Llama 2;在訓練成本方面,Llama 2 的 700 億參數模型則通過分組機制降低成本,且同時還可以處理更多請求。上周 Meta 正式發布 Llama 2 後,Llama 2 強大的參數規模以及性能表現,對 OpenAI 帶來了不小的壓力,人稱為 "GPT-4 最強平替 "。
Llama 2 作為 Meta 發布的首個免費商用的開源大模型,這并不等于各個商業公司可以自行創建大語言模型(LLM)。使用開源 AI 模型構建 LLM 和聊天機器人仍需要專業人員完成。
一、比起 GPT-4,Llama 2 的優勢在哪裡?
The Information 稱 Llama 2 的發布是 Meta 的奪權之作,因為幾乎每家公司都可以選擇收費商用,但 Meta 選擇免費商用。OctoML 的聯合創始人 Jason Knight 認為,Llama 2 将搶奪 OpenAI 旗下 GPT-4 的市場份額,OctoML 是一家機器學習(ML)模型優化和部署的平台公司。
但 OpenAI 或将推出與 Llama 2 對标的開源商用 LLM,據 The Information 消息,OpenAI 未發布模型的代号是 G3PO,但尚未有消息表明它将于何時發布。考慮到 OpenAI 的員工數量,新模型的發布或将延遲。
The Information 稱,OpenAI 将開發一種閉源模型與開源模型的混合體,前者用于營收,後者仍将向開發者開放,并吸引開發者為閉源模型付費。目前,扎克伯格并未對此消息作出進一步表示。
Llama 2 大模型有 70 億、130 億、700 億三個參數規模版本。參數是指大模型在訓練過程中用來對所學内容進行編碼的參數,參數數量越大,模型復雜性越高,對伺服器的性能要求也越高。較小的模型運行起來更快更輕松,較大的模型更适合復雜推理任務。
▲圖為 Llama 2 大模型 70 億、130 億、700 億三個參數規模版本介紹
與其他 LLM 相比,Llama 2 在性能方面表現居中。根據大規模多任務語言理解(MMLU,一種常用的文本模型基準),Llama 2 的 700 億參數模型在數學和編碼等各種任務上的表現優于 MosaicML 預訓練轉換器(MPT)和阿聯酋阿布扎比的技術創新研究所(Technology Innovation Institute)的 Falcon。但 Llama 2 的表現略落後于 OpenAI 的 GPT-3.5,在編碼基準方面,兩者有很大差距。與 GPT-4 和谷歌的 Pathways Language Model(PaLM)2(Bard 聊天機器人的運行基礎)相比,Llama 2 的性能差距更大。
在訓練和使用 AI 模型的成本方面,Llama 2 的表現則優于其他 LLM。Llama 2 的 700 億參數模型中使用了分組查詢注意機制(Grouped-Query Attention,GQA)。GQA 是一種降低 LLM 内存需求的建模技術。這一技術可以降低每一字節的計算成本,使得 LLM 能同時處理于更多的請求。如今這一點變得越發重要,因為訓練和使用 AI 模型的成本激增。以 GPT-4 為例,它的訓練費用就超過了 1 億美元。
二、商用免費後,公司還需要花錢買 LLM 嗎?
Llama 2 發布後,似乎每家公司都可以自行創建 LLM 和聊天機器人了。但這沒有想象中那麼簡單。使用開源 AI 模型構建 LLM 和聊天機器人需要多重步驟,包括托管模型、構建聊天機器人用戶界面、以模型路徑存儲專有數據,以及微調模型。這些都是費時費力的工作,即使是 Databricks 等銷售 AI 模型工具的公司也需要數據科學家來完成這項任務。
然而,AI 從業者和愛好者已經開始互幫互助,共同開發 Llama 2。Reddit 社區上充斥着各種教程,從如何告訴模型要生成什麼東西,到教人們個性化設定 Llama 聊天機器人。與此同時,GitHub 上的 Ollama 也發布腳本,輔助用戶在筆記型電腦上本地運行 Llama 2,這也讓更多的人可以使用 Llama 2。
▲圖為 Reddit 社區 Llama 2 讨論區
Meta 此舉還将提升提供應用程式和伺服器的公司的估值,因為此類公司能夠輔助運行人工智能模型。據多位知情人士透露,Modal 最近以 1.5 億美元的稅後估值獲得了 Redpoint Ventures 的資助,該公司主營業務為幫助開發者在線上運行人工智能應用程式代碼。Redpoint 發言人兼 Modal 首席執行官拒絕置評。
結語:Meta 的開源之舉或将影響 AI 領網域生态
Llama 2 的發行吸引了 AI 業内大量的關注,為 Meta 在 AI 領網域的後續發展提供了難得的機會。Meta 的免費開源之舉可能會給業内帶來一個蓬勃發展的開發者生态,開發者可以免費改進各項應用軟體。
對于包括 OpenAI 在内的其他 AI 企業來說,Meta 的行為是否會改變他們的產品發布節奏?或者影響其内部戰略決策?對此,我們也會持續關注。
來源:The Information