今天小編分享的互聯網經驗:直擊2024WCC現場:從棋盤世界看大模型落地,歡迎閱讀。
文 | AI 大模型工場,作者|參商,編輯|星奈
2016 年,AlphaGo 橫空出世,以 4:1 的戰績擊敗世界圍棋冠軍李世石,震驚全球。
AlphaGo 的勝利成功地展示了 AI 在解決復雜策略問題上的潛力,成為人工智能發展史上的一個重要轉捩點。
從象棋到圍棋,從深藍到 AlphaGo,棋盤上的對弈不再是單純的勝負較量,而是人類智慧與人工智能深度交融的舞台。
如今,AI 與棋盤的故事仍在繼續。2024 年國際象棋世界冠軍賽(WCC)11 月 23 日正式拉開帷幕,現任棋王丁立人接受年僅 18 歲的印度國際象棋特級大師多曼拉朱 · 古凱什挑戰「王冠之戰」。
值得關注的是,谷歌作為此次大賽的贊助商,在現場也帶來了 AI 深度體驗項目。
AI 大模型工場有幸受到谷歌邀請來到在新加坡舉辦的 2024 年國際象棋世界冠軍賽(WCC)現場,見證這場巅峰對決。
在 WCC 現場,谷歌展示了基于棋類 AI 的最新探索,從 AlphaGo 到 AlphaZero,從 Chess Fiction 到 GenChess,AI 在跨越棋盤,落地我們生活的方方面面。
一、現場直擊 WCC,用 AI 解鎖國際象棋新玩法
在 WCC 上,谷歌的 AI 體驗區成為焦點。 三大展台 Chating Chess、Chess Fiction 和 GenChess,讓 AI 用遊戲的方式幫助大家重新理解象棋。
Chating Chess:象棋知識一鍵解鎖
顧名思義,Chating Chess,是能夠通過對話快速提升觀眾對國際象棋的理解水平的 "AI 解說員 "。在對話框中向 Gemini 提問關于國際象棋的問題,Gemini 就會深入淺出地講解各種復雜概念
比如,對象棋小白來說,只需輸入 " 如何下象棋 " 這類關鍵詞,Gemini 就能詳細講解國際象棋的規則,不僅如此,它還能預測你的後續問題。同時,如果你将棋局給它,它還能指導你的棋局下一步。
Chess Fiction:象棋賽事的拟人化演繹
Chess Fiction 通過 Gemini 模型,将經典賽事拟人化,讓不懂國際象棋的人也能像讀小說一樣了解整個對戰的過程,賦予每場比賽叙事的魔力。
例如,當你輸入 " 将 2017 年侯逸凡對戰 Borya Ider 的比賽改編成一個奇幻故事 ",Gemini 會生成以下充滿想象力的内容:
在神秘的直布羅陀王國,一位名為侯逸凡的女巫以精妙的策略和冷靜的判斷統治棋盤。面對充滿大膽與冒險精神的蒙古騎士 Borya,他們展開了一場智謀與魔法的對決。侯逸凡召喚了 " 迷人的棋子 " 和 " 無懈可擊的防御網 ",而 Borya 釋放的 " 兇猛騎士 " 與 " 雷霆般的攻擊 " 同樣讓人屏息凝神……
即便是毫無棋藝基礎的觀眾,也能通過這種叙事方式,感受到棋盤上的緊張與刺激,體會象棋場上的激烈對決。
GenChess:打造你的專屬棋盤
在 AI 體驗環節,最具創意的還要當屬 GenChess,可以輸入 prompt 生成專屬的風格化國際象棋。
比如,我讓 Gemini 幫我生成了一個 Butter Bear(黃油小熊)的專屬棋子,一個奶黃色的可愛小熊棋子,拿捏人心。不僅如此,還可以用同一主題生成不同各具特色的棋盤進行對弈。
在展示牆上,也放滿了人們的想象力,包括餃子、雞蛋等個性化的象棋。
實際上,這些好玩的 AI 應用背後包括影像生成模型 Imagen 3 和 Gemini Flash 模型等。
就在 3 個月前,谷歌發布了影像生成模型 Imagen 3,在文本語義還原、色彩搭配、文本嵌入、影像細節、光影效果等方面相比第二代大幅度提升,同時還能支持生成人物影像。GenChess 背後 Imagen 3 功不可沒。
這些技術背後都體現了 AI 在棋盤世界的新高度,而提到這一切,不得不追溯到 AI 棋類技術的開端,從 AlphaGo 到 AlphaZero,以及背後推動這場變革的關鍵人物。
二、AI 棋盤背後的那個男人:從 AlphaGo 到 AlphaZero
今年諾貝爾獎 AI 成為當之無愧的頂流,先是 AI 教父辛頓憑借深度學習的突破獲得諾貝爾物理學獎; 第二天 Google DeepMind 聯合創始人兼首席執行官 Demis Hassabis。
則因開發了 AlphaFold 解決蛋白質結構預測難題而獲得諾貝爾化學獎。
實際上,谷歌在棋盤上取得的成就,Demis Hassabis 在其中扮演了重要角色。
在新加坡 WCC 現場,谷歌組織了一場 Demis Hassabis 自傳電影《The Thinking Game》觀影會。這個電影耗時五年拍攝,詳細講述了 Demis 及其團隊如何一步一步探索 AI 的未來發展,以及為人類帶來的價值。
Demis 的故事始于棋盤,13 歲時,他已是國際象棋少年冠軍,并且世界排名第二。那時,他腦海中萌生了一個獨特的想法:如果将所有人類智慧與計算機結合,會發生什麼?
Demis 似乎一直在思考,14 歲考上牛津,他本可以在 15 歲時進入劍橋學習計算機科學,但他延遲了兩年才入學。在此期間,他進入公司,設計開發出經典模拟遊戲《主題公園》。
但這只是開始,他始終在思考大腦是如何工作的,為了更深入地了解大腦的工作原理,Demis 在 2005 年進入倫敦大學學院攻讀認知神經科學博士學位,并開創性地發現了大腦中海馬體與情景記憶間的關系。
2010 年,Demis 與蘇萊曼、謝恩 · 萊格共同創辦了 DeepMind,目标明确:創造能夠 " 思考 " 的人工智能。2016 年,AlphaGo 的問世震撼全球,這個 AI 程式不僅在圍棋上戰勝了世界冠軍李世石,更向世界證明了人工智能在復雜認知任務上的強大潛力。随後的 2017 年,AlphaGo 以 3:0 的比分擊敗圍棋世界第一柯潔,再次刷新了人類對 AI 的認知。
但 Demis 沒有止步于此。兩年後,AlphaZero 的推出,徹底改變了遊戲規則。不同于 AlphaGo 的圍棋專項訓練,AlphaZero 通過自我對弈,迅速掌握圍棋、國際象棋和将棋的復雜規則,超越了所有人類頂級棋手的水平。
2018 年,Demis 再次将目标鎖定在科學的前沿:蛋白質折疊。通過 AlphaFold,DeepMind 成功預測了蛋白質的三維結構,并且将所有成果開源。
電影中經常出現的列車旅行場景仿佛象征着人生的旅途以及關于 AGI 發展的征程。
最打動我的是 Demis 對于 AGI 闡釋 " 人工智能需要具備通用性,即,可以解決任意問題而不是單一問題。這是智慧的體現。"
從 AlphaGo 到 AlphaZero 再到 AlphaFold,Demis 對于 AGI 的技術理念奠定了 Gemini 系列模型發展的基石,Google 在棋盤上驗證的技術也在不斷向更廣泛的醫療、文化、社會領網域擴展。
三、從棋局開始,不止棋局
自 20 世紀 50 年代以來,遊戲一直是人工智能的試驗場。
1990 年,奇努克 ( Chinook ) 機器擊敗了世界上最好的跳棋選手,這是一個轉捩點。7 年之後,IBM 的 " 深藍 " 超級計算機超越了國際象棋特級大師加裡 · 卡斯帕羅夫 ( Garry Kasparov ) 。
2011 年,另一台 IBM 機器 " 沃森 " 超越了《危險邊緣》遊戲的所有赢家。
之後,谷歌的 AlphaGo 橫空出世、 AlphaZero 全面進化,AI 在棋類領網域的勝利不僅展示了其超越人類的決策能力,更驗證了深度學習的潛力。
自 2022 年 OpenAI 發布 ChatGPT 後,大模型爆火出圈,從科技巨頭到初創公司,從模型到應用,AI 發展進入加速期。
谷歌也迅速響應,去年年底 Gemini1.0 誕生,當時和市面上現有大語言模型相比,Gemini 從一開始定位就是多模态模型,可以處理包括文本、影像、視頻、音頻等不同類型的信息。
今年 2 月,Google 又推出了擁有百萬 token 超長上下文視窗的 Gemini 1.5 。三個月後又推出 1.5 Pro ,上下文長度翻倍,達到 200 萬 token,同時也推出輕量級 Gemini 1.5 Flash,速度更快、效率更高。
同時,在多模态領網域,谷歌也發布了文生圖工具 Imagen 3、與 Youtube& 音樂家合作的 "AI 音樂沙盒 ",以及視頻生成模型 Veo。
如果說去年大家還在卷模型,到今年一個明顯的變化是卷向應用層,讓 AI 落地到應用場景成了潮水翻湧的方向。
在 Gemini 模型的加持下,谷歌在應用方面也做出不少探索。
除了上文展示的 Chess Fiction、Chating Chess、GenChess 等在棋盤上推出的應用外,谷歌在 AI 搜索中引入多模态搜索功能,計劃推出訂閱服務 "Gemini Advanced",允許用戶定制個性化助手,實現高度個性化互動。
在辦公領網域,谷歌将 Gemini 1.5 Pro 整合至 Workspace Labs,用戶可利用 AI 快速生成郵件摘要、分析 PDF 附件、提取 Google Meet 錄音摘要等,提升辦公效率。
在端側,則計劃将輕量化的 Gemini Nano 引入 Pixel 手機,借助 "Circle to Search" 功能,用戶通過簡單手勢即可搜索文字、圖片、視頻或音頻,進一步優化移動端 AI 體驗。
還有最近爆火的 AI 播客生成工具 NotebookLM,連 OpenAI CEO 奧特曼都連連稱贊。
事實上,當下國内外的大模型公司已經逐漸從單純的技術比拼階段,悄然向產品應用的競争維度過渡。谷歌在這一轉型浪潮中,憑借自身極為廣泛且完善的產品生态體系,将 AI 技術落地到搜索、辦公軟體、手機等諸多實際應用場景之中,穩步構建起龐大而多元的商業生态格局,并确立其在市場中的領先地位。
谷歌的 AI 技術在棋盤上找到歸宿,但它的影響力早已突破棋局本身。棋盤的勝利成為 AI 技術向辦公、生活、醫療、科學等更廣泛領網域延展的基石。AI 正在不斷突破行業邊界,融入人類社會的方方面面。
棋局之上,AI 為人類解鎖了更多可能。
注:部分 Google 技術僅适用于出海開發者 。