今天小編分享的互聯網經驗:大模型,阿裏雲不做選擇題,歡迎閲讀。
圖片系 AI 生成
什麼加速了雲的發展?
自 2006 年雲計算誕生之日算起,互聯網和移動應用、雲原生技術普及、企業向先進技術架構演進、中企全球化等因素,先後塑造了雲計算的内在與外表,造就了一個數萬億規模的行業。
毋庸置疑的是,生成式 AI 将是雲計算產業下一個革命性要素,但是,雲廠商如何做大模型,行業内還沒有達成一致。
開源與閉源,自研與投資,基礎模型與工程化落地,技術創新與產業生态,阿裏雲沒有做選擇題,而是兼收并蓄,去構建一個 AI 與雲的商業循環。
5 月 9 日,阿裏雲正式發布通義千問 2.5,中文性能全面趕超 GPT-4 Turbo,同時通義千問 1100 億參數開源模型在多個基準測評收獲最佳成績,超越 Llama-3-70B,成為開源領網域最強大模型。此外阿裏雲還更新了百煉平台,更便于支持大型企業和成熟開發者的需求。
通義千問 2.5,地表最強中文大模型
基礎模型是生成式 AI 產業的起點,模型本身在快速發展,從單一語言模型,到能處理文檔、音視頻、代碼等各方面的能力,每個維度能力的寬度和深度都在快速地增加,在未來一段時間仍将繼續迭代。
對于大模型廠商來説,本身的基礎模型能力至少要保持在第一梯隊,才有海量的用户基礎和可持續的吸引力。相比通義千問 2.1 版本,通義千問 2.5 的理解能力、邏輯推理、指令遵循、代碼能力分别提升 9%、16%、19%、10%,中文能力表現更為突出,在權威基準 OpenCompass 上,通義千問 2.5 得分追平 GPT-4 Turbo。
和部分廠商不同的是,阿裏雲開源和閉源兩條路并重,在開源方面走的是 " 全模态、全尺寸 " 路線。" 阿裏雲的策略不是簡簡單單的開源,我們是要做開源最強的模型 ",阿裏雲 CTO 周靖人表示。
最新款開源的 1100 億參數模型 Qwen1.5-110B,在 MMLU、TheoremQA、GPQA 等基準測評中超越了 Meta 的 Llama-3-70B 模型;在 HuggingFace 推出的開源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 衝上榜首。
通義也不斷豐富多模态模型和專有能力模型,例如通義千問視覺理解模型 Qwen-VL-Max 在多個多模态标準測試中超越 Gemini Ultra 和 GPT-4V,通義千問代碼大模型 CodeQwen1.5-7B 是 HuggingFace 代碼模型榜單 Big Code 的頭名,也是助手通義靈碼的底座。
周靖人提到," 我們是全球唯一一家積極做最先進的 AI 模型,同時也敢于全方位開源的雲計算廠商,因為我們認識到,今天只有把 AI 能力真正賦能給企業,才能推動整個企業產業的快速發展。"
百煉 2.0,開發性與自由度
大模型應用落地的過程中,需要試驗各種各樣的模型,并且企業希望以高性價比的方式融合在自己的業務開發裏,業務場景復雜、自身數據敏感,企業如何安全高效地将大模型和業務有機結合,這是工程化落地的重要課題。
阿裏雲百煉的一大特點,在于最大程度的開放性和自由度。當下一些大模型應用平台采用封閉鏈路,不支持替換原子能力,導致企業開發應用時無法引入自研插件,和業務場景充分融合。
百煉 2.0 平台從模型開發、應用開發到算力底座全面更新。" 當下企業應用大模型存在三種範式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基于模型開發應用,其中最典型的需求是 RAG,以企業數據對大模型進行知識增強。圍繞這些需求,百煉打造了模型中心和應用中心,提供最豐富的模型和最易用的工具箱。" 周靖人説。
對希望直接調用模型進行推理的企業,百煉集成了上百款大模型 API,除了通義、Llama、ChatGLM 等系列,還首家托管百川等系列三方模型,值得一提的是,這可能是阿裏大手筆投資大模型創業廠商帶來的優勢。
對需進一步訓練模型的用户,百煉提供從數據管理、模型調優、評測到部署的全鏈路模型服務,用户可彈性按需調用算力,無需關心底層架構。訓練過程可視化,還可自動評測模型質量,并與其他模型對比。
對希望打造 RAG 應用的企業,百煉支持 Assistant API 開發模式,可在百煉上輕松創建知識庫,并一鍵開啓知識檢索增強(RAG),通過 Assistant API 聯合輸出。同時,百煉支持 agent 智能體開發,并能實現多智能體協作、對話記憶等高級功能。
大模型生态亟需建設
相比于海外市場,國内對大模型生态建設的需求更高。據外媒消息,美國初步計劃對最先進的專有 AI 模型實施出口管制,諸如此類風險,要靠系統生态協作來緩解單點難題。
開源模型和百煉平台也是是生态建設一部分,開源模型能夠讓更多的開發者使用,并于其上搭建更復雜的應用,甚至更復雜的 Agent,更好地服務企業,從而推動 AI 產業的發展。百煉平台能夠鏈接模型能力和業務場景,幫助大模型在各行各業落地。
阿裏雲不僅在做通義模型的開源,同時也在積極推廣 AI 社區的發展,魔搭社區總用户數超過 500 萬,成為了中國最大的 AI 模型社區,社區内有大量的 AI 模型,以及各種數據和經驗,為大模型落地提供指引。
" 一門技術的良好發展一定要有一個好的生态,這也是為什麼阿裏雲積極參與生态建設,從魔搭社區到開源體系,更多反饋才能實現更多的業務創新,激發更多模型的應用。" 周靖人説。
阿裏雲在大模型領網域正在構建大循環,以基礎模型為起點,開放生态聚合用户和行業,更多人使用通義模型,也就能進一步優化模型效果,并且帶動阿裏雲服務的采用,最終阿裏雲想實現的是—— AI 即雲計算。(本文首發于钛媒體 APP,作者 | 張帥,編輯 | 蓋虹達)