今天小編分享的互聯網經驗:大廠模型商用開源,阿裏雲起了個頭,歡迎閲讀。
看來開源的力量勢不可擋。
8 月 3 日,通義千問 70 億參數通用模型和對話模型(簡稱 Qwen-7B 和 Qwen-7B-Chat)出現在 AI 模型社區魔搭 ModelScope 上,兩款模型均開源、免費、可商用。
由此,阿裏雲成為國内大廠中第一個開源大模型的企業。
Qwen-7B 是支持中、英等多種語言的基座模型,Qwen-7B-Chat 是基于基座模型的中英文對話模型,在許多測基準,比如 MMLU、C-Eval 中,Qwen-7B 在 70 億參數規模領網域上都取得了良好的表現,阿裏雲表示其部分能力甚至可以趕超一些 120 億參數大模型。
用户目前已經可以從魔搭社區直接下載模型,也可通過阿裏雲靈積平台訪問和調用這些模型,而通過開源代碼,用户可以很方便地在消費級顯卡上部署和運行模型。阿裏雲基于大模型的服務,包括訓練、推理、部署和精調都可以應用在上述兩個模型上。
這不是國内第一個免費、可商用的大模型。就在半個月前,智譜 AI 宣布 ChatGLM-6B 和 ChatGLM2-6B 允許免費商業使用,百川智能的 Baichuan 13B 模型在發布的同時就開源允許免費商用。
但通義千問是成為了第一個科技大廠的開源大模型,它的開源将被視為國内 " 百模大戰 " 進入新階段的一個标志——現在無論中美,也無論巨頭還是中小初創公司,有關大模型開源的看法正在趨近于一致。
在 Meta 宣布開源 LLaMA 2 的時候,Meta 首席科學家、圖靈獎得主 Yann LeCun 就宣稱,大模型行業的競争格局将會改變。這是因為閉源依靠大力出奇迹的方式證明了大模型路線的可性能和極限,而開源則會通過繁榮的生态,讓大模型變得真正可用、易用。
換而言之,大模型本身的神秘光環正在逐漸消褪。當技術不再難以逾越,繁榮的開源生态以及由此帶來的群策群力的技術迭代和突破就成為了新的護城河。在 7 月舉辦的世界人工智能大會上,阿裏雲将促進中國大模型生态的繁榮作為自己的首要目标。
為此,阿裏雲打出了一套組合拳。
比如阿裏雲的靈積模型服務平台,它提供了一系列自動化的模型上雲工具鏈路,讓模型不僅能通過推理 API 被集成,也能通過訓練微調 API 實現模型定制化。另外,去年推出的 AI 模型社區魔搭,已經聚集了 20 多家頂尖人工智能機構貢獻的 1000 多款開源模型。它們彼此的部署鏈路是打通的,也就是説來自社區的模型可以通過靈積實現服務化——這看上去就像是個起步階段的模型自由市場,它能夠實現,當然是開源的功勞。
而任何市場都需要充分的競争,歸根結底,阿裏雲想要通過降低門檻來讓開源大模型生态繁榮起來,就需要提供足夠豐富、足夠高質量的開源大模型參與其中。
通義千問的開源勢在必行。
由此,千帆競渡的百模大戰,現在已經進入到了真刀真槍貼身肉搏環節——模型究竟好不好,不是靠吹出來的,開源到社區裏,群眾自會檢驗。
歡迎來到自由的大模型開放世界。