今天小編分享的互聯網經驗:百模大戰之下,阿裏雲最在意的還是生态,歡迎閲讀。
" 我們做模型不是為了和其他模型競争。"
在 2023 年世界人工智能大會期間,阿裏雲 CTO 周靖人這樣説道。這似乎和許多人津津樂道的 " 百模大戰 " 有些出入,不是無論大廠小廠都在開發自己的模型,然後彼此競争麼?阿裏雲也是其中之一啊。
這種痴迷于零和遊戲的刻畫其實有些粗糙而一廂情願。它忽視了阿裏雲作為一家雲計算廠商的本質,和它在提出模型即服務的模式後真正在一步步建設的東西。
也就是,雲計算服務是它一切動作的出發點。
通義系列的模型只是其中一部分。在這之外,周靖人提醒人們關注阿裏雲做模型的邏輯。" 我們有多重身份。" 周靖人説。" 我們自己的大模型是為了服務好雲上的企業和 ISV,讓他們可以更簡單地調用模型,或把大模型集成到他們的業務體系裏,這樣我們可以期待應用的爆發。同時,我們也要服務自研模型的創新者和模型開發者,給他們提供工具和生态。"
而無論是直接滿足自己平台上的已有客户的需求,還是給更多的模型創造者們提供高質量的算力和工具等基礎設施,歸根到底,阿裏雲要通過降低門檻來讓生态繁榮,讓模型真正發揮作用,來解決實際問題。沒人想要讓大模型僅僅停留在一種被讨論被神化或被妖魔化的概念了。
更多的積木
為達到這個目标,阿裏雲的一個做法是,要通過各種工具建設讓模型的研發和使用像搭積木一樣簡單。
當天周靖人公布了阿裏雲提供的更多的 " 積木 "。
首先是通義大模型體系的新積木,文生圖的模型通義萬相。
和此前出現的通義千問,通義聽悟一起,它們組成目前阿裏雲自己的大模型系列,并且成員肯定還會繼續擴充,沿着阿裏雲多模态的既定路線繼續進行。
據介紹,通義萬相基于阿裏研發的組合式生成模型 Composer,簡單説,它通過把圖片的元素進行拆解的方法來控制生成的穩定性,這是一種基于擴散模型的組合式生成框架。周靖人參與其中的 Composer 相關論文已被國際 AI 頂會 ICML 2023 收錄。
在這樣的新思路下,它在產品側除了提供傳統的基于提示詞的文生圖功能,還提供了相似圖生成,可以提供想要的風格的圖片來幫助生成;以及風格遷移功能,可以更直觀的把一個給定圖片的風格實現在另一張生成圖片上。這些很明顯都在解決用户生成圖片的穩定性和可用性的問題。
在自研體系之外,阿裏雲也在為百模市場造積木,比如靈積模型服務平台。
它給模型創造者提供标準上雲接口,也給要使用模型的應用開發者提供統一 SDK。
對模型,它提供一系列自動化的模型上雲工具鏈路,支持模型的自主接入,把它們引向阿裏雲積累的模型推理微調拓展以及自适應彈性部署等各種服務能力,并且可以根據需求進行公共部署或用户自定義獨占部署等。這使得模型不僅能通過推理 API 被集成,也能通過訓練微調 API 實現模型定制化。
對 AI 開發者,可以通過統一的 SDK 方便地獲取不同模型并集成到自己的應用中。
當前靈積平台上托管了很多業界領先大語言模型,除了阿裏雲自己的通義千問,更多的是 ChatGLM-v2、百川、姜子牙、Dolly 等三方模型。
靈積背後是阿裏雲強大的算力和 AI 開發平台,包括傳説中擁有十萬卡 GPU 的國内最強智算集群,以及支持萬卡的單任務分布式訓練規模的機器學習平台 PAI。
這些積木将會降低大模型的研發和使用門檻,讓中國的模型市場生态更自由、更活躍。而 AI 開發者社區魔搭,是未來的大模型自由市場的預演。
模型自由市場的預演
魔搭社區是阿裏去年推出的 AI 模型社區,上線以來增長驚人,短短半年多已經是國内最大的 AI 模型社區,目前集聚了 180 多萬開發者和 900 多個優質 AI 模型,這些模型由 20 多家頂尖人工智能機構貢獻,累計下載量突破 3600 萬。這其中,有約 100 個參數規模在 10 億以上的大模型。
在魔搭,所有模型生產者都可上傳模型,驗證模型的技術能力,探索模型的應用場景和商業化模式。魔搭社區打通了與靈積平台的部署鏈路,支持社區的模型通過靈積來實現服務化。
大會當天,阿裏雲又推出了一個新工具 ModelScope GPT(魔搭 GPT),它能任意組合、自由調度魔搭平台所有大小模型。
魔搭 GPT 是一個聽得懂人話的工具,你只需要跟它對話,提出需求,它就可以通過中樞大模型去尋找調用小模型,組隊完成你給的任務。
事實上它也是今天被越來越多模型開發者重視的 AI Agent 技術路線的一種,簡單説就是可以基于理解自主決策的助手。
" 它也是一種模型,更多是 AI Agent,它通過對其他模型,甚至是對其他整個互聯網的各種工具的理解,結合自然語言和多模态的能力,能夠更智能化地拆解復雜問題,在每一個子問題裏調用相關模型去解決。" 周靖人説。
" 我們需要一個通用的 Agent,結合模型力量去幫我們完成各種任務。我相信這個想象空間是非常巨大的。" 他説。
ModelScope GPT 可以視作一種 " 打樣 ",基于魔搭社區的生态基礎,開發一款工具,增加開發者與模型社區的互動,增加模型社區的要素流動,激發整個社區的創新。
據介紹,ModelScope GPT 現已能夠調用魔搭社區十多個核心 AI 模型的 API,包括地址解析,信息抽取,翻譯,語音視頻合成等等,未來它的模型 API 清單會不斷擴容,能力也會不斷增強。
阿裏雲決定把 ModelScope GPT 的數據集和訓練方案開放,供開發者自己上手,制作趁手的模型調用工具,用到任何想用的地方。
有生态,自然會有商業化
今年的人工智能大會上,大模型已經成為絕對焦點,穿梭展區和論壇,你會發現 MaaS(模型即服務)概念已無處不在。
去年 11 月,阿裏雲率先在業界提出 "Model as a service" 概念,同時推出 AI 模型社區魔搭。彼時行業還響應者不多,而今天它已經衍生出各種理解。
大模型正在重塑雲計算行業。雲計算服務商,需要圍繞 AI 模型這個中心,提供包括模型訓練、推理、部署、精調、測評、產品化落地等全方位服務。
" 阿裏雲在踐行 MaaS 開發範式,圍繞 AI 模型,重新定義和設計雲產品的方方面面。" 周靖人説。
某種程度上,在 MaaS 的思路下,阿裏雲平台不止服務自研模型,而更像是一個大模型的 " 天貓 ",這是一個所有模型都可以通過它直接提供給潛在用户的平台,而非以自營為主、所有其他東西都服務于自營的模式。
" 阿裏雲将把促進中國大模型生态的繁榮作為首要目标,向大模型創業公司提供全方位的服務。" 周靖人説。只有真正讓模型帶來的技術能力深入群眾,解決真正的問題,才能讓生态繁榮。
MaaS 範式也許并不直接通向某個具體的商業模式。周靖人認為,當模型自由市場的生态開始繁榮,當我們真正開始用大模型解決實際問題,商業化的模式會自然生成,而這個過程一定是基于公共雲路線之上的。
" 今天我們希望一個模型能夠觸達更多的開發者,或者説產生更多的真實價值,而它只有通過公共雲的方式才能觸達到全社會,今天如何利用好公共雲的技術優勢和價值,是企業和開發者能夠實現業務突破的重要方面。"
雲計算就是以基礎設施的方式讓更多人享用計算能力,大模型歸根結底也是計算能力的一次進步,而讓更多人以更低門檻獲得新技術帶來的新計算能力,才是雲廠商該扮演的角色。