今天小編分享的科技經驗:阿裡吳泳銘:生成式AI的最大想象力,不是做超級應用,而是改變物理世界,歡迎閱讀。
文 | 鄧詠儀
編輯 | 蘇建勳
又一年過去了,AGI 進度如何了?
自 OpenAI 的 ChatGPT 震撼全球,全球 AI 界的終極目标—— AGI(通用人工智能)暫未實現。但全球 AI 界的風向标,已經從談 GPT-4 為主的通用、底層大模型(Foudation Model),快進到 2024 年的多模态。
一切都圍繞着 AI 應用展開了。從年初的 Sora、Suno,到近期的 o1(OpenAI 的多模态新模型)、Cursor(AI 編程應用)和火得不可開交的機器人(新時代的時髦稱呼:具身智能),毫無疑問,AI 正在加速落地,并且走入物理世界中。
在國内,阿裡可謂是對這波生成式 AI 浪潮投入力度最大,節奏最為激進的巨頭。阿裡自己的通用大模型家族 " 通義 ",從底層的通用大模型,到影像、視頻、代碼等領網域的應用,均有覆蓋。
在外部,阿裡甚至還投資了國内大模型六小虎中的五家,出手果決——現任阿裡巴巴集團 CEO、阿裡雲智能集團董事長兼 CEO 吳泳銘則是這場 AI 浪潮中,主導阿裡動向的主舵手。2023 年,吳泳銘在接任阿裡雲後,就馬上提出了 "AI 驅動、公共雲優先 " 的戰略。阿裡雲整體開始了一場降本增效,劍指 AI 的大變革,目标更加集中。
在 9 月 19 日演講的演講中,吳泳銘表示,過去 22 個月,AI 發展的速度超過任何歷史時期,但我們依然還處于 AGI 變革的早期。" 生成式 AI 最大的想象力,絕不是在手機螢幕上做一兩個新的 Super App,而是接管數字世界,改變物理世界。" 他說。
核心觀點:
AI 發展速度已經超過任何歷史時期,但依然處于 AGI 變革的早期。
下一階段先進模型的投入門檻是幾十億、幾百億美金級别。
生成式 AI 最大的想象力,絕不是在手機螢幕上做一兩個新的超級 app,而是接管數字世界,改變物理世界。
機器人将是下一個迎來巨變的行業。未來所有能移動的物體都會變成智能機器人。
未來幾乎所有的軟硬體都會具備推理能力,它們的計算内核将變成 GPU AI 算力為主、CPU 傳統計算為輔的計算模式。
過去一年,阿裡雲投資新建了大量的 AI 算力,但還是遠遠不能滿足客戶的旺盛需求。
人們對新技術革命,往往對短期高估,又對長期低估,但它會在你的懷疑中成長,在你在遲疑中錯過大趨勢。
阿裡巴巴集團 CEO 兼任淘天集團董事長、首席執行官、阿裡雲董事長與 CEO
附吳泳銘演講全文:
歡迎來到 2024 雲栖大會。在剛剛過去的夏天,阿裡雲全面支撐巴黎奧運會實現了歷史性突破,雲計算首次超越衛星,成為奧運主要轉播方式。AI 也首次廣泛應用于奧運會。今天,雲栖大會的焦點也是 AI。我主要分享三點内容:
第一,過去 22 個月,AI 發展的速度超過任何歷史時期,但我們現在依然還處于 AGI 變革的早期階段。
大模型技術快速迭代,技術可用性大幅提升。大模型已經具備了文本、語音、視覺的多模态能力,能夠開始完成復雜指令。去年,大模型還只能幫助程式員寫簡單的代碼,今天已經能直接理解需求,完成復雜的編程任務。去年,大模型的數學能力還只有中學生水平,今天已達到國際奧賽金牌水平,并在物理、化學、生物等多方面學科接近博士水平。
同時,模型推理成本指數級下降,已經遠遠超過摩爾定律。一年來,通義千問 API 在阿裡雲百煉上的調用價格下降了 97%,百萬 Tokens 調用花費最低已經降到了 5 毛錢。推理成本是應用爆發的關鍵問題,阿裡雲會努力把成本繼續降下去。
開源生态蓬勃發展。今年 6 月,通義千問開源 Qwen2,迅速登頂 Huggingface 的全球開源模型排行榜。在 Huggingface 上,Qwen 的原生和衍生模型接近 5 萬個,排名全球第二。阿裡雲魔搭社區上有超過 1 萬個模型、服務了超過 690 萬開發者。
這一切才剛剛開始,要實現真正的 AGI,下一代模型需要具備更大規模、更通用、更泛化的知識體系,同時也将具備更復雜更多層次的邏輯推理能力。全世界先進模型競争的投入門檻,将達到數十億、數百億美金的級别。AI 具備創造能力、幫助人類解決復雜問題的路徑清晰可見,也打開了 AI 在各行業場景中廣泛應用的可能性。
第二,AI 最大的想象力不在手機螢幕,而是接管數字世界,改變物理世界。
今天很多行業内人士一直在想 AI 最大的應用是什麼,可能一直在想手機上有什麼 AI 時代創新的超級 APP。但我們認為 AI 最大的想象力絕對不是在手機螢幕上,AI 最大的想象力是在通過滲透數字世界、接管數字世界,并改變物理世界,這才是 AI 最大的想象力。
我們不能只停在移動互聯網的視角看未來。生成式 AI 最大的想象力,絕不是在手機螢幕上做一兩個新的超級 app,而是接管數字世界,改變物理世界。
過去三十年,互聯網浪潮的本質是連接,互聯網連接了人、信息、商業和工廠,通過連接提高了世界的協作效率,創造了巨大的價值,改變了人們的生活方式。但生成式 AI 是通過生產力的供給創造了新的價值,從而為世界創造了更大的内在價值,也就是總體提高了整個世界的生產力水平。這種價值創造,可能是移動互聯網連接價值的十倍、幾十倍。
我們認為生成式 AI 将逐漸滲透數字世界,并接管數字世界,物理世界的大部分事物都會具備 AI 能力,形成下一代的具備 AI 能力的全新產品,并與雲端 AI 驅動的數字世界連接產生協同效應。
很長一段時間,AI 的焦點主要集中在模拟人類的感知能力,比如自然語言理解、語音識别、視覺識别。但是生成式 AI 的崛起,帶來了質的飛躍,AI 不再僅僅局限于感知,而是首次展現了思考推理和創造的力量。
生成式 AI 讓世界有了一個統一的語言—— Token。它可以是任何文字、代碼、影像、視頻、聲音,或者是人類千百年來的思考。AI 模型可以通過對物理世界數據的 Token 化,理解真實世界的方方面面,比如人類行走、奔跑、駕駛車輛、使用工具,繪畫、作曲、寫作、表達、教學、編程的技巧,甚至是開公司創業。理解之後,AI 就可以模仿人類去執行物理世界的任務。這将帶來新的產業革命。
我們看到,汽車行業正在發生這樣的變革。之前的自動駕駛技術,是靠人來寫算法規則,幾十萬行代碼,仍然無法窮盡所有的駕駛場景。采用 " 端到端 " 的大模型技術訓練後,AI 模型直接學習海量人類駕駛視覺數據,讓汽車具備了超越大部分司機的駕駛能力。
機器人将是下一個迎來巨變的行業。未來,所有能移動的物體都會變成智能機器人。它可以是工廠裡的機械臂、工地裡的起重機、倉庫裡的搬運工、救火現場的消防員、包括家庭裡的寵物狗、保姆、助理。
未來,工廠裡會有很多機器人,在 AI 大模型的指揮下,生產機器人。現在每個城市家庭裡有一輛或者兩輛車,未來每個家庭可能會有兩三個機器人,幫助人們提升生活當中的效率。
可以想見,AI 驅動的數字世界連接着具備 AI 能力的物理世界,将會大幅提升整個世界的生產力,對物理世界的運行效率產生革命性的影響。
第三,AI 計算正在加速演進,成為計算體系的主導。
無論是我們看到端側的計算,還是雲端的世界,這都是一個非常明顯的趨勢。生成式 AI 對數字世界和物理世界的重構,将帶來計算架構的根本性變化。過去幾十年,CPU 主導的計算體系,正在加速向 GPU 主導的 AI 計算體系轉移。未來幾乎所有的軟硬體都會具備推理能力,它們的計算内核将變成 GPU AI 算力為主、CPU 傳統計算為輔的計算模式。
我們看到,在新增算力市場上,超過 50% 的新需求由 AI 驅動產生,AI 算力需求已經占據主流地位。這一趨勢還會持續擴大。過去一年,阿裡雲投資新建了大量的 AI 算力,但還是遠遠不能滿足客戶的旺盛需求。
今天我們接觸到的所有客戶、所有開發者、所有 CTO,幾乎都在用 AI 重構自己的產品。大量新增需求正在由 GPU 算力驅動,大量存量應用也在用 GPU 重新改寫。在汽車、生物醫藥、工業仿真、氣象預測、教育、企業軟體、移動 APP、遊戲等行業,AI 計算正在加速滲透。在各行各業,看不見的新產業革命正在悄然演進。
所有行業,都需要性能更強、規模更大、更适應 AI 需求的基礎設施。
阿裡雲正在以前所未有的強度投入 AI 技術研發和基礎設施建設。我們的單網絡集群已拓展至十萬卡級别,正在從芯片、伺服器、網絡、存儲到散熱、供電、數據中心等方方面面,重新打造面向未來的 AI 先進基礎設施。
從歷史經驗來看,人們對新技術革命,往往對短期高估,又對長期低估。因為在新技術應用早期,滲透率還比較低,人們經驗沒有發生過此類事件,大部分人的本能會產生懷疑,這很正常。但新技術革命會在人們的懷疑中成長,讓很多人在遲疑中錯過。
站在 AI 時代浪潮的開端,我感到無比興奮。今天,我們請到大模型、自動駕駛和機器人三個領網域的企業家和科學家。他們正在飛奔着用 AI 重構我們的世界,期待他們的精彩分享。
謝謝大家。希望大家度過一個充實、愉快的雲栖。