今天小編分享的互聯網經驗:AI是公有雲的出路,阿裡雲做了示範,也拿出了成績單,歡迎閱讀。
" 吳泳銘趕上了一個好時候。"
11 月 15 日晚,阿裡巴巴集團公布季度業績,截至 2024 年 9 月 30 日止季度,阿裡雲整體收入(不計來自阿裡巴巴并表業務的收入)收入 296.1 億元,同比增長超過 7%,經調整 EBITA 利潤達到 26.61 億元,同比增長 89%,超過分析師預期的 24.93 億元。
财報提到,業績由公共雲業務的雙位數增長帶動,其中包括 AI 相關產品采用量的提升。AI 相關產品收入連續五個季度實現三位數的同比增長。一言以蔽之,阿裡雲靠 AI 增收又增利。
要知道,自 2023 年 9 月 10 日接任阿裡雲 CEO 起,這算是吳泳銘接手阿裡雲的一年答卷,也是阿裡雲收入(不包括阿裡巴巴内部用雲)恢復增長的第二個季度,有人說 " 吳泳銘趕上了一個好時候 ",大模型刺激了公有雲的采用量。
但其實并不是所有的雲廠商都有和阿裡雲同樣的收獲。橫向來看,其他廠商還在找到更有效率的方法,縱向來看,幾年前阿裡雲就想靠 AI 來帶動雲的采用,但是并沒有取得預期的效果,既有當時的 AI 價值太分散的原因,也有雲和 AI 沒有正确融合的原因。如今,吳泳銘示範了 AI 之于公有雲,可持續健康增長的路徑。
為 AI 基礎設施 " 燒錢 ",現金流大降
阿裡雲連續第四個季度實現增速上漲。
财報提到,阿裡雲還在繼續縮減非公有雲業務的規模,逐步降低利潤率較低的項目式合約類收入并專注于高質量收入,非公共雲收入是下降的。阿裡雲把收入增減控制在一個相對平衡的比例,非公有雲業務的減少,不至于影響到整體大盤的增速。
同時,阿裡雲推動產品結構轉向利潤率更高的包括 AI 相關產品在内的公共雲產品,以及提升運營效率,部分被對客戶增長和技術的投入增加所抵消。
AI 基礎設施的投入有多燒錢,從阿裡财報可見一斑。截至 2024 年 9 月 30 日止三個月,阿裡巴巴自有現金流為 137.35 億元人民币,相較截至 2023 年 9 月 30 日止三個月的 452.2 億元人民币下降 70%。
對阿裡雲基礎設施的投入是最大原因,其他原因還包括取消年度服務費後向天貓商家的退款,以及縮小若幹直營業務規模等因素而導致的其他營運資金變動。
吳泳銘在财報電話會上表示,阿裡巴巴的許多資本支出都投入在雲端,尤其是 AI 基礎設施方面,這是基于對短期需求的理解以及對長期需求的判斷的結果。阿裡巴巴将繼續投資于 AI 基礎設施。因為預期未來對 AI 相關的雲服務需求将随之增長。
就短期需求而言,對 AI 的需求持續呈爆炸式增長,包括驅動 AI 的計算能力、訪問模型的 API 服務,現在甚至不可能完全有效地滿足所有這些需求。這就是為什麼我們在短期内進行積極的投資,但從長遠來看,我們将 GenAI 的這一機會視為歷史性機遇,這種機遇可能每 20 年才會出現一次。
" 我們認為未來對推理的需求具有很高的确定性,看看 OpenAI 最新的模型 o1 及其 COT 思維鏈,就會發現推理需求将呈指數級增長。這解釋了為什麼我們在短期和長期内都在積極投資與人工智能相關的基礎設施,因為我們對這種需求非常樂觀。" 他說。
AI 終于能拯救公有雲了
公有雲廠商唯一且最核心的任務,就是如何驅動更大的雲消費,比如大數據、物聯網等業務,AI 不是沒有被關注到,早在上一波 AI 熱潮時,阿裡雲就希望借 AI 驅動雲的采用,但事與願違。
彼時純做 AI 的 " 獨角獸 " 都活的一般,大型公有雲廠商做的 AI 葉門庭冷落,都是因為缺少規模化的用戶,所有業務都要靠大牛帶隊專人解決,AI 也就沒有促進雲的進一步爆發。
但在大模型這一波,公有雲廠商看到了期待中的雲 +AI 的模型。一位阿裡雲内部人士對钛媒體 App 表示,在以大模型為代表的 AI 業務中,AI 的消耗占比可能最多只有三成,剩下的都是原來雲計算的產品和服務。
" 當一個 AI 的功能封裝成一個智能體也好,或者是一個類似于 SaaS 的服務給到用戶側。其中調用 AI 模型的能力是一部分,甚至在整個應用各種服務的消耗裡面,它都不是主要的部分。" 他說。
就連大模型公司也在雲上尋找合适的技術棧。月之暗面采用阿裡雲數據庫,整合并總結來自多種信息源的數據,幫助智能助手 Kimi 準确理解用戶的搜索意圖;MiniMax 基于阿裡雲容器服務、雲數據庫等產品和服務,優化模型數據預處理和數據檢索等環節,提升用戶互動體驗。
吳泳銘也提到," 雲計算是一項技術優勢和規模效應都很重要的業務,最近價格降低,是因為優先考慮擴大用戶群,這将吸引大量新用戶來使用這些模型在阿裡雲上部署他們的應用程式,他們對我們的計算能力、存儲數據庫和其他產品的使用增加,我們擁有完整的技術堆棧,只要人們來到這個平台,他們最終将不可避免地使用多種不同的雲產品。"
圖片系 AI 生成
雲基礎設施轉向 AI 基建
過去 CPU 主導的計算體系已快速向 GPU 主導的 AI 計算體系轉移。吳泳銘也道出了他的觀察:不同公司在不同的軟體中,都在研發 AI agent,包括自動化流程,以及用 AI 重塑以前小的訓練模型,總體看到,我們的技術和美國的發展過程比較類似,大量原本用 CPU 的運算需求,都在用 GPU 重構,GPU 重構的基礎就是大量 AI 模型的應用。
基于這樣的觀察和判斷,阿裡雲正以 AI 為中心,全面重構底層硬體、計算、存儲、網絡、數據庫、大數據,并與 AI 場景适配、融合,加速模型的開發和應用,打造 AI 基建。
例如,阿裡雲推出最大支持單機 16 卡的磐久 AI 伺服器、數據吞吐量達 20TB/s 的 CPFS 檔案存儲,以及可支持超過 10 萬個 GPU 穩定連接的高性能網絡架構 HPN7.0。阿裡雲 ACS 首次推出 GPU 容器算力,人工智能平台 PAI 實現了萬卡級别的訓練推理一體化彈性調度,AI 算力有效利用率超過 90%。
同時,阿裡雲百煉目前已集成上百款大模型 API,覆蓋國内外主流模型。繼 5 月首次大幅降價後,阿裡雲百煉平台上的三款通義千問主力模型再次降價。Qwen-Turbo 價格直降 85%,低至百萬 tokens 0.3 元,Qwen-Plus 和 Qwen-Max 分别再降價 80% 和 50%。
通過全棧優化,阿裡雲打造出一套穩定和高效的 AI 基礎設施,連續訓練有效時長大于 99%,模型算力利用率提升 20% 以上。
在大模型方面,相比 2023 年 4 月的最初的通義大模型,Qwen-Max 的理解能力提升 46%、數學能力提升 75%、代碼能力提升 102%、幻覺抵御能力提升 35%、指令遵循能力提升 105%,模型與人類偏好的對齊水平提升了 700% 以上。
吳泳銘還斷言,這一波生成式 AI 對雲的需求,前期是模型訓練推動的。但是對算力的需求在放大,未來模型訓練公司會逐步收窄到幾家公司,尤其是在基礎大模型上。另外在各行各業,比如自動駕駛、金融都有垂直行業模型訓練需求,現在訓練和推理需求都有比較好的增長,但是未來的百分比,AI 推理需求會帶動更大比例的增長。(本文首發于钛媒體 APP,作者 | 張帥,編輯 | 蓋虹達)