今天小編分享的科技經驗:谷歌 vs OpenAI:決戰2024?,歡迎閲讀。
谷歌與 Open AI"AI 大戰 " 的真正交火将會在 2024 年。
2023 年最後一個月,谷歌發布了原生多模态大模型 Gemini,稱其在大語言模型領網域的 32 個常用測試指标裏,有 30 項領先于 GPT-4。Gemini 針對不同任務設定了 Nano、Pro、Ultra 三個版本,目前上線的只是 Gemini Pro 版," 頂配 "GeminiUltra 将于 2024 年初推出。随後,谷歌發布 2023 年度 AI 研究總結,給出 " 全面碾壓 OpenAI" 的萬字長文。
OpenAI 首席執行官山姆 · 奧特曼公布的聖誕願望清單,可以理解為 OpenAI 的 " 應戰書 ",并透露将在 2024 年推出 GPT-5。
外界評論,2024 年全球 AI 大模型比拼的焦點是 GPT-5 和 Gemini Ultra,雖然目前兩個模型都還被 " 捂 " 在閨中,無法直接比較,但模型之争背後的數據、算力、生态的全方位較量已經開始。
1 月 11 日凌晨,OpenAI 的 GPT Store ( GPT 應用商店 ) 正式上線,首先面向付費用户開放,最終将直接進行創收。這意味着 "App Store" 商業模式引入大模型領網域。也是在這幾天,谷歌 DeepMind 宣布了 SARA-RT、RT-Trajectory、AutoRT 三項具身智能成果。
2024 年元旦剛過,OpenAI 與谷歌 AI 之争火藥味彌漫,一場關于 AI 核心基礎的變革山雨欲來。
round1:多模态數據,誰擁有更多 ?
2024 年大模型的競争焦點,業界的共識是 " 多模态模型 ",無論是 GPT-5 還是 Gemini Ultra,都主打 " 多模态 ",這意味着訓練這些模型需要海量高質量的視頻、音頻、圖片等數據。
谷歌和 Open AI,誰更擁有源源不斷的此類資源?
360 集團創始人、董事長周鴻祎在與甲子光年創始人兼 CEO 張一甲的對話中表示," 人才密度、算力密度和數據質量的高低是決定通用大模型勝負的關鍵,谷歌的人才不是問題,算力也不是問題,在數據方面擁有搜索、YouTube 和 Android 生态系統 "。有消息稱,谷歌訓練 Gemini 時所用的數據量是 GPT-4 的兩倍之多。
Open AI 同樣擁有自己的生态。如果説搜索、短視頻是互聯網時代的 " 超級應用 ",大模型時代,殺手級應用很可能是 "AI 智能體 ",從這個意義上看,Open AI 的 GPT 商店有可能建立龐大的 "AI 超級應用 "。據悉,目前用户自定義構建的 ChatGPT 助手已超過 300 萬個。
接下來,數據競争的焦點有可能是機器數據。螞蟻集團副總裁、金融大模型負責人王曉航表示:" 有一種説法是預計 2025 年左右,全世界 50% 左右的數據會來自感知和傳感等 IoT(物聯網)數據,這部分數據能產生新的能力。" 目前的數據來源于傳統計算平台,如 PC、伺服器、手機和平板電腦,嵌入式數據則來源于極其廣泛的設備類型。
因此,大模型與硬體結合将成為 2024 年重要的創新方向,也将創造智能硬體新物種。去年 11 月,由山姆 · 奧特曼投資的智能穿戴設備公司推出一個基于大模型的智能穿戴設備 AI Pin,有人稱其 " 有可能取代智能手機 "。AI Pin 将于 2024 年 3 月批量上市。
基于此,我們就很好理解,為什麼谷歌 Gemini 大模型也包括了 Nano 版本。" 當手機上的傳感器都跟大模型整合,會產生非常多的應用場景,谷歌推出 Gemini Nano 版本,能夠在終端、手機等各種設備上部署,與安卓系統緊密聯系在一起。" 周鴻祎表示。
Pixel 8 Pro 在錄音機應用中使用 Gemini Nano 來總結會議音頻,即使沒有網絡連接也可以實現
大模型的目标不僅在于理解文本、圖片、視頻,它必須真正理解物理世界。谷歌 Deep Mind 首席執行官德米斯 · 哈斯比斯表示:" 谷歌 DeepMind 已經在研究如何将 Gemini 與機器人技術結合,與世界進行物理互動,真正的多模态需要包括觸摸和觸覺的反饋。"
2024 年元旦剛過,谷歌 DeepMind 又拿出了 SARA-RT、RT-Trajectory、AutoRT 三項機器人與大模型結合的成果,其中 AutoRT 是一個機器人數據收集系統,可以一次管理 20 個機器人。而在此前,OpenAI 也投資了一家人形機器人公司 1X。谷歌與 OpenAI,誰都不願錯失任何一個有可能產生 AI 爆品的機會。
Round2:算力是關鍵底座,誰主動權更大?
在谷歌發布 Gemini 大模型時,特别強調自家的 TPU(AI 專用張量處理器)v4 和 v5e 對大規模訓練的給力支撐。為何?因為算力資源是 AI 的關鍵基礎設施,是 AI 研究、AI 模型訓練、AI 商業應用的關鍵利器。有信息透露,谷歌訓練 Gemini1.0 時所用算力是 OpenAI 訓練 GPT-4 的四到五倍。谷歌除了想凸顯自身的算力優勢,還要做算力服務的生意。當天,谷歌還發布了号稱 " 迄今為止最強大、最高效、可擴展的 TPU 系統 "Cloud TPU v5p,将用于開發更高層次的 AI 大模型。
在大多數基準測試中,Gemini 的性能都超越了 GPT-4
谷歌這樣做當然也希望 " 打臉 "OpenAI ——就在谷歌發布 Gemini 前,OpenAI 宣布暫停 ChatGPT Plus 付費新用户的注冊,此前還出現了 ChatGPT 周期性的宕機。直到去年 12 月中旬, 山姆 · 奧特曼才發文稱:" 我們重新啓動了 ChatGPT Plus 付費訂閲的注冊,感謝您的耐心等待,同時我們找到了更多的 GPU。"
山姆 · 奧特曼沒有説明,其 GPU 究竟來自英偉達還是微軟,但至少承認了一件事:OpenAI 缺算力。盡管 OpenAI 的 " 好夥伴 " 微軟已推出 AI 專用處理器,OpenAI 也用上了,甚至還挖來了前谷歌 TPU 負責人主管 OpenAI 的硬體,但短期來看,其算力資源仍無法與谷歌相提并論。有報道稱,即便 OpenAI 在兩年内将 GPU 的總數增加四倍,依然無法趕上谷歌的算力資源,目前 OpenAI 、Meta、CoreWeave、甲骨文、亞馬遜的 GPU 總和,仍小于谷歌所擁有的 TPU v5 的數量。
Google 數據中心内的一排 Cloud TPU v5p AI 加速器超級計算機
算力資源的差距有可能在 2024 年改變谷歌與 OpenAI 模型差距,因為擁有更多的算力資源意味着能進行更多的試驗、更快的迭代模型。按照 SemiAnalysis 預測,到 2024 年年底,谷歌模型訓練的 AI 算力資源有可能是 OpenAI 的 20 倍。
業界也有人説,缺算力花錢買就好了,OpenAI 正在啓動新一輪融資,并不缺錢,自己賺錢能力也蒸蒸日上。最新消息顯示,OpenAI 近期年化收入突破 16 億美元,主要收入來源包括 ChatGPT Plus 會員服務、API 模型訪問以及與微軟的合作,預計到 2024 年底 OpenAI 年化收入可達 50 億美元。
更何況,剛剛上線的 GPT Store,帶來 OpenAI 新的商業變現的想象空間。
不過,小冰公司 CEO 李笛認為:"GPT Store 的建立不是為了商業模式,更是為了收集究竟什麼樣的 GPT 落地應用是有效的,是為了從開發者處獲得想法和靈感。" 這樣看起來,OpenAI 建立 GPT Store 的目的并不單純,那麼開發者會不會把好的創意拿出來,就是未知數。瀾碼科技創始人、CEO 周健也認為,當前 GPT-4 的能力對于發展 GPT store 還存在瓶頸,GPT Store 開發者是否能夠做出用户願意買單的應用,需要等到 OpenAI 發布 GPT-5 後才知。
更何況,目前情況看,芯片并不是想買就能買到,OpenAI 更不希望淪為 GPU 和雲計算公司的 " 打工人 "。目前看,OpenAI 與微軟的關系依然牢固,微軟也拿到了 OpenAI 無投票資格的董事會成員資格,但福布斯卻預測,2024 年 OpenAI 與微軟就有可能走向分手," 随着 OpenAI 大到蠶食微軟客户 "。OpenAI 還在尋找英偉達之外其他途徑來解決眼下算力不足的問題,包括最近與 AMD 洽談合作的可能性,也自主研發芯片、評估潛在收購目标。
基于種種不确定性,OpenAI 希望将更多的 " 算力主動權 " 掌握在自己手裏。最近,OpenAI 與人工智能芯片初創公司 Rain AI 在 2019 年籤署的一份意向書被曝出,OpenAI 将購買該公司總價值 5100 萬美元的 NPU 芯片,而在此前,山姆 · 奧特曼自己也投資了這家公司。這一舉動引起廣泛關注,因為 Rain AI 的 NPU 芯片采用神經拟态技術,模仿人腦的結構和功能,被認為具有低成本高能效的潛力,有望為 OpenAI 提供所需的硬體支持。
與 Rain AI 的這一交易,被視為 OpenAI 為确保其 AI 項目的芯片和硬體供應而進行的關鍵舉措之一。但事實上這家芯片創業公司給出的出貨時間至少要到 2024 年底。算力的差距,可能在 2024 年成為 OpenAI 與谷歌 AI 競争的 " 關鍵變量 "。
Round3:醖釀底層變革,誰先實現 AGI?
更或許,谷歌與 OpenAI 的真正較量并不是 GPT-5 和 Gemini Ultra,而是誰先實現 AGI(通用人工智能)。
目前看,無論是 GPT 還是 Gemini 都基于 Transformer 架構。谷歌團隊在 2017 年發表的論文《Attention Is All You Need》提出了 Transformer 架構,如今的主流大模型產品,大多基于該架構。有人分析,谷歌擁有原創 AI 架構、算力、數據、技術、人才等顯著優勢,但其推出的 Gemini 也就僅領先 GPT-4 一點點,這或許意味着 Transformer 架構存在天花板。
Google DeepMind 資深工程師盧一峰在與美國工程院院士張宏江對話中坦言," 現在的 Transformer 架構已經比當年有了很大的優化和改進 ",從 2016 年到現在,整個業界在軟體、硬體和數據方面對 Transformer 架構進行了許多組合優化," 已經将其推進到了一個局部最優狀态 "。" 我認為我們可以繼續改進它,還有很大的空間,但要顯著改變它則有一定難度。 這個難度在于這幾個維度已經彼此交織在一起。" 盧一峰説。
需要有新的架構來 " 接力 " 這場 AI 加速跑。
福布斯在最近出爐的《2024 年十大 AI 趨勢預測》指出," 盡管我們不認為 Transformer 架構在 2024 年将消失,但确信将出現新一代更先進的 AI 架構替代方案,而且新的替代架構将會在 2024 年得到真正的應用。" 福布斯在預測中提及了斯坦福大學的 Chris Ré 實驗室正在構建一種新的模型架構,這種架構可随序列長度以次二次方的方式擴展(而不是像 Transformer 那樣以四次方的方式擴展)。将使得人工智能模型計算密度更低,并能更好的處理長序列。" 替代候選 " 還包括麻省理工學院開發的液态神經網絡以及由 Transformer 聯合發明人之一 LlionJones 所創公司推出的 Sakana 架構。據悉,目前 Transformer 架構的五位共同發明者均已離開了谷歌,開啓了各自的 AI 創新創業之旅,這些親手孕育了 Transformer 的人有可能就是 Transformer 的 " 掘墓人 "。
此外,随着大模型能力的不斷演進,需要帶來 " 跨越式變革 " 的未來計算,量子計算機或許是硬體 " 接盤 " 方案。創世夥伴資本主管合夥人周炜表示:" 量子計算擅長的就是處理排列組合、并發的問題,當量子計算與大模型結合在一起能夠解決很多問題。"
" 首先,人工智能領網域的算法,大部分屬于并行計算範疇。而量子計算機擅長進行并行計算,因為它可以同時計算和存儲 0、1 兩種狀态,無需像電子計算機那樣消耗額外的計算資源,譬如串聯多個計算單元,或将計算任務在時間上并列。計算任務越復雜,量子計算就越具備優勢。其次,運行 ChatGPT 所需的硬體條件,同樣也十分适合導入當前體積龐大的量子計算機,二者都需要安裝在高度集成的計算中心裏,由一支專業化技術團隊進行管理支撐。" 中國現代國際關系研究院科技與網絡安全研究所人工智能項目負責人譚笑間表示。
2022 年,來自谷歌、微軟、加州理工學院等機構的研究者從原理上證明了 " 量子優勢 " 在預測可觀測變量、量子主成分分析以及量子機器學習中确實存在。量子計算與人工智能兩大前沿技術合流的趨勢正在變得越來越明朗。在量子計算、量子機器學習方面,谷歌是先行者。如果量子計算機能夠成為未來 AI 硬體的替代方案,谷歌無疑擁有比 OpenAI 更多的優勢。
谷歌會比 OpenAI 更快實現 AGI 嗎?亦或,最先實現 AGI 的既不是谷歌也不是 OpenAI, 而是另外其他公司?一切皆有可能。