今天小編分享的科學經驗:OpenAI和谷歌,AI對線中的飛馳人生,歡迎閲讀。
到底什麼時候,才能有一家公司趕超 OpenAI?這句問題,想必是過去一年多來,萦繞在不少讀者心中的困惑。
如果全世界只有一家公司能趕超 OpenAI,谷歌應該是最有希望的選手。
同為北美 AI 巨頭的谷歌,與 OpenAI 有着相同的 AGI 目标、世界級的技術人才、全球資金資源,就連 OpenAI 大模型的核心 Transformer 架構,都是谷歌原創發明的。
然而 2023 年至今,AI 領網域風雲迭起,OpenAI 永遠快谷歌一步。谷歌每次拿出一個 " 復仇大殺器 ",想一雪前恥的時候,總會被 OpenAI 搶走風頭。
比如最新推出的核彈級多模态大模型 Gemini 1.5,只在科技話題榜上 " 炸裂 " 了幾個小時,就因為緊随其後推出的 Sora 過于炸裂、更吸引眼球,而變得無人在意。
毫無疑問,AI 領網域正在進行着一場世界上最精彩的 " 速度與激情 ",領先的 OpenAI 赢得漂亮,緊随其後的谷歌也輸得體面。我發現它們的境遇,被龍年春節檔的熱門電影,給精準拿捏了。
如果説 OpenAI 是驚豔四座、激動人心的《熱辣滾燙》,那谷歌就像是《飛馳人生 2》中艱難追夢的中年賽車手,鼓起勇氣全速前進,結果不是赢,而是來了個大翻車。
誰能摘下賽道終點 AGI 的聖杯,結果還未可知,這一年多來,僅僅是欣賞這一長程賽事的初始賽段,都已經令人極為振奮了。
谷歌與 OpenAI 的 AI 對線,可謂是屢戰屢敗、屢敗屢戰。我們就從這場精彩的 " 雙雄競速 ",來整體看一看北美 AI 巨頭的產業對壘形勢。
谷歌三連敗
北美 AI 巨頭的激情對線
目前,在争奪 AGI 通用人工智能聖杯的賽場上,分别有三支北美 AI 巨頭:OpenAI、谷歌、Meta。
其中,Meta 走的是開源路線,其大模型系列 LLaMA 是目前全球最活躍的 AI 開源社區。而 OpenAI 和谷歌則在同一條賽道上,主要打造 " 閉源 " 大模型。
盡管 OpenAI 被嘲諷 " 不再 Open",谷歌工作人員也大膽谏言 " 我們和 OpenAI 都沒有護城河 "。但換個角度,閉源的業務策略要説服用户付費,必須提供高質量模型、具備難以替代的能力優勢,這也會驅動模型廠商持續創新,保持競争優勢,是 AI 產業中一股不可缺少的商業力量。
所以,北美 AI 三巨頭的對壘格局,就是 Meta 卷生态,OpenAI 與谷歌卷模型。
那麼,把目光聚焦到模型賽道上,比賽情況如何呢?
2023 一整年,和 OpenAI 同一賽道的谷歌,深深品嘗到了 peer pressure 同輩壓力的滋味。
這場競速,可以分為三個賽段:
Round1.ChatGPT VS Bard.
結果不用多説,這是一場谷歌被 OpenAI" 摘了桃子 " 而開啓的競賽,從此就只能一路跟在 OpenAI 的尾氣後面。
2022 年 11 月,OpenAI 發布 ChatGPT 一鳴驚人,開啓了全球大語言模型的熱潮。
其中,ChatGPT 的基礎技術 Transformer 是谷歌推出的,大語言模型的湧現現象是谷歌研究員 Jason Wei 發現的(後來跳槽到了 OpenAI)。用谷歌的技術,搶谷歌的人,衝擊谷歌的 AI 領導地位,OpenAI 可謂是一通 " 騎臉輸出 "。
谷歌的應對,是 " 一怒之下怒了一下 "。
2023 年 3 月,谷歌緊急發布了 Bard。但這個模型本身的性能就比較弱,上線時功能有限,只支持英文,只針對少數用户,跟 ChatGPT 完全不能打。
Round2.GPT-4 VS PaLM2.
有人説,谷歌采用的是 " 田忌賽馬 " 策略,第一局故意放出了比較弱的機器學習模型 Bard。這話有一定道理,但架不住 OpenAI 的每匹馬都是好馬。
OpenAI 很快推出了更新版的 GPT-4,并開放了 GPT-4 的 API,把谷歌甩得更遠了。
5 月的谷歌 I/O 2023 大會,派出來對打 GPT- 4 的 PaLM 2,也是一個 " 過渡產品 "。谷歌研究副總裁 Zoubin Ghahramani 對外表示,PaLM 2 是對早期模型的改進,僅僅縮小了谷歌與 OpenAI 在 AI 方面的差距,但并沒有整體超越 GPT-4。
這一輪,谷歌仍然落後。谷歌顯然也清楚這一點,在這場大會上同時宣布,正在訓練 PaLM 的繼任者,名為 Gemini,押注了上億身家,準備在年底上演 " 王子復仇記 "。
Round3.Gemini 家族 VS Sora+GPT-5。
2023 年底的 12 月,谷歌 Gemini" 雖遲但到 ",這個谷歌目前最強大、最通用的 AI 模型,被媒體稱為 " 復仇殺器 "。這期間,OpenAI 上演了一出 " 甄嬛回宮 " 的宮鬥大戲,沒有特别炸裂的產品。這一次,谷歌能奪回屬于自己的一切嗎?
很遺憾,谷歌并沒能上演 AI 領網域的 " 龍王歸來 "。
三個尺寸的 Gemini:Nano、Pro 和 Ultra,其中 Gemini Pro 在常識推理任務中落後于 OpenAI 的 GPT 模型,Gemini Ultra 對于 GPT-4 僅有幾個百分點的優勢,而 GPT-4 是 OpenAI 一年前的產品。而且,Gemini 還被爆出,宣稱打敗 GPT-4 的多模态視頻,有後期制作和剪輯的成分,用中國模型產生的中文語料進行訓練,自稱是文心一言。
谷歌一鼓作氣,一腳油門,Gemini Ultra 發布還沒幾天,就推出了多模态大模型 Gemini 1.5,能夠穩定處理高達 100 萬 token,創下了最長上下文視窗的紀錄。
這是一個激動人心的成果,如果沒有 Sora 的話。
OpenAI 幾個小時之後,就推出了文字視頻生成模型 Sora,用前所未有的視頻生成性能,以及世界模型的產品化,再一次驚豔了世人,搶走了本應屬于 Gemini 1.5 的話題度,也強化了自己的 AI 領導地位。目前人們傾向于認為,OpenAI 還是領先谷歌一籌。
此前大家都猜測是 GPT-5 已經訓練得差不多了,面對谷歌目前最強的模型 Gemini 1.5,已經有人隔空喊話奧特曼,問他還要把寶貝捂到什麼時候,還不快點放出 GPT-5。
至此,為期約一年的北美 AI" 田忌賽馬 ",以谷歌的三連敗,暫時告一段落。
AGI 的殊途
難以飛馳的谷歌
AGI 是一場長長的賽事。拉長時間軸,谷歌與 OpenAI 的一年對壘與一時成敗,或許未來看都不算什麼。有資格走上頂級賽道,本身就是谷歌 AI 實力的一種證明。
比起輸赢結果,更值得讨論的是,谷歌變成 " 卷王 " 卷了一整年,為什麼會一直被 OpenAI 甩在身後,怎麼折騰都跟不上?
田忌賽馬,輸一次是戰術失誤,次次都輸,可能就能關注一下,是不是從馬種、馬圈、草料等源頭,就已經存在問題了。
回到源頭,谷歌和 OpenAI 可謂是同歸、殊途。
同歸,是雙方都以實現通用人工智能,摘下 AGI 聖杯作為目标;
殊途,是雙方選擇的技術路線不同。OpenAI 将更為通用的語言能力,作為實現 AGI 的基礎,因此采用了對 NLP 領網域至關重要的 Transformer 架構,打造了一系列 GPT 模型,才有了 ChatGPT 的驚豔亮相。
而谷歌則不然。多年來,谷歌的 AI 研發機構 DeepMind,将強化學習、深度學習用于解決各種人工智能問題,技術積累非常廣泛。比如石破天驚的 AlphaGo、徹底改變生物學的 AlphaFold,以及 Transformer 等 NLP 技術。
這就相當于,兩個車手在為比賽準備賽車,OpenAI 為 AGI 選了一個場地,比如 " 方程式賽車 ",然後以語言為核心進行模型的開發制造,對賽車(模型)的結構、長寬、發動機、汽缸等進行優化改造(工程化)。而谷歌的 DeepMind 則不确定哪種車能終結 AGI 比賽,手裏的技術工具又很多,于是方程式賽車、跑車、摩托車都造一下試試。
兩種路線原本并沒有什麼優劣之分。但随着大語言模型的 " 智能湧現 ",證明了 OpenAI 選擇的技術路線更有希望實現 AGI,谷歌 DeepMind 的技術路線就暴露出了明顯的短板:
1. 方向分散,成本高昂。在各個技術方向上投入的泛創新,消耗了大量資金,DeepMind 與谷歌母公司 AlphaBeta 在商業化上的矛盾日趨加深。在 OpenAI 大幅融資加速的時候,谷歌為了加大對 AI 的投資,通過裁員來節省成本。
2. 選型太多,難以聚焦。谷歌開創了許多技術,但每個技術的重視程度、持續深入強度也被分散了,四處打井不出水。最典型的就是 Transformer 架構,由谷歌發明,但被 OpenAI 發揚光大。ChatGPT 的湧現現象,也是研究員在谷歌發現之後,但得不到重視,出走 OpenAI 後向前推進。
3. 落地遲緩,成果太慢。谷歌内部對 AI 的保守也是出名的,導致其即使掌握了先進的技術,成果轉化的效率也很低下。有前谷歌員工曾吐槽,谷歌的項目一般都是先吹一陣牛,然後什麼也不發布,一年後再把這個項目給砍了。這一點在 Sora 的爆火上就能看到,訓練 Sora 使用的擴散模型(diffusion model)、文生圖模型,谷歌都有相應的技術儲備和成果,但就是沒能先搞出 Sora 這樣的產品。
可以看到,由于一開始就押注錯了賽道,等到大語言模型成為 AGI 最有潛力的實現路徑,OpenAI 領先的大勢已成。這時的谷歌再要回到 OpenAI 所在的技術賽道上,當然就處于劣勢身位了。
一步錯,步步錯的 " 人生 "
挺住意味着一切
坦誠地説,谷歌已經在積極解決問題,包括技術戰略選擇失誤、内部的管理效率人事冗餘、AI 技術人才的外流等。
去年 4 月,谷歌将自己的兩個 AI" 扛把子 " 團隊——谷歌大腦和 DeepMind 合并,共同進行 Gemini 的開發。從最終效果來看,Gemini 的表現是很優秀的,1.5 版本是目前全球最領先的大模型之一。内部資源也大幅度向 AI 領網域傾斜,一些外流的 AI 人才回歸谷歌。
實際行動表明,谷歌在明确了賽道之後,追趕 OpenAI 的決心和速度都是一等一的。
但持續落後的現實也充分诠釋了一點:自己的失敗固然可怕,朋友的成功更讓人揪心。
盡管谷歌竭力解決自身的種種弊病,全力推動大模型,但架不住 OpenAI 的加速度更強大。
一方面,OpenAI 的研發團隊可謂是全力以赴,而谷歌新合并的團隊還需要磨合。Sora 核心研發人員 Bill Peebles 曾透露,團隊每天基本不睡覺高強度工作了一年。而谷歌大腦和 DeepMind 合并之後,很多員工不得不放棄自己原本熟悉的軟體,放棄原本開展的項目去開發 Gemini,這些内部磨合導致的項目延遲、停滞,必然會給谷歌追趕 OpenAI 帶來阻礙。
另外,相比谷歌亡羊補牢式地招回人才,OpenAI 虹吸全球頂級 AI 人才的氣勢如虹。就在 2 月份,Altman 公開在社交媒體上表示," 所有關鍵資源都已到位,非常專注于 AGI",在線誠聘人才。AI 的競争歸根結底是人才的競争,因為 AGI 最重要的是智力資源,而最頂尖最優秀的人才一共只有那麼多,這也讓人為谷歌能否追趕上 OpenAI 捏了一把汗。
電影《飛馳人生 2》中,主角再度嘗試賽車而翻車後,他沒有繼續追求賽場上的赢,而是作為一個深愛着賽車運動的車手,踏上賽場,只為證明自己。
谷歌與 OpenAI 的對線,也不能歸于簡單的輸和赢。正如谷歌在「Why We Focus on AI ( and to what end ) 」中所言:我們相信 AI 能夠成為一項基礎技術,徹底改變全世界人民的生活——這正是我們追求的目标,也是我們的激情所在!
所有勇于下場、站上跑道的 AI" 賽車手 ",都值得掌聲。而這場充滿了速度與激情的 AGI 比賽,一定還會帶給觀眾席上的我們,更多震撼。