今天小編分享的教育經驗:DeepMind CEO 放話:未來十年賭上視覺智能,挑戰 OpenAI 語言統治地位,歡迎閱讀。
作者 | InfoQ
來源 | 管理智慧 AI+
咨詢合作 | 13699120588
文章僅代表作者本人觀點
去年成功斬獲諾貝爾獎之後,Demis Hassabis 決定與一位國際象棋世界冠軍打場撲克以示慶祝。Hassabis 一直痴迷于遊戲,這股熱情也成為他 AI 先驅之路上的契機與驅力。
近日,做客一檔名為《60 分鍾》的訪談欄目,講述了他如何帶領眾多研究者追逐新的技術 " 聖杯 " ——通用人工智能(AGI),一種兼具人類靈活性與超人般速度與知識儲備的矽基智能形态。除此之外,他也在訪談中透露了 DeepMind 未來的研究方向以及有可能亮相的產品和技術。
" 天才少年 "Hassabis 的 AI 之旅始于國際象棋
Hassabis 于 2010 年與他人共同創立了了 AI 公司 DeepMind,2014 年該公司被谷歌以 5 億多美元收購。2017 年,他發明了 AI 算法 AlphaZero,它只需要國際象棋規則和四個小時的自對弈,就能成為有史以來最強的國際象棋選手,擊敗人類國際象棋大師。
2024 年,Hassabis 與同為諾貝爾化學獎得主的 DeepMind 總監約翰 · 江珀 ( John Jumper ) 共同獲得了諾貝爾化學獎,獲獎原因是他創建了一個 AI 模型 AlphaFold2,該模型可以在幾分鍾内準确預測幾乎所有 2 億種蛋白質的復雜結構。AlphaFold 蛋白質結構數據庫免費提供這些蛋白質結構,目前已覆蓋 190 個國家的 200 多萬用戶,為帕金森病治療和抗生素耐藥性等領網域的高級研究鋪平了道路。
Hassabis 強硬的管理手腕,或許與他從小時候就征戰國際級圍棋大賽的經歷有關。
Hassabis 的 AI 之旅有一個意想不到的開始:他早年對國際象棋的十分熱愛。在獲得 2024 年諾貝爾化學獎之前,Hassabis 就是一名兒童國際象棋冠軍,他從四歲起就開始下棋。到 13 歲時,他已經是一名國際象棋大師,在國際比賽中與成年人一較高下。
本月早些時候,在劍橋大學的一次演講中,現年 48 歲的 Hassabis 解釋說,國際象棋讓他 " 思考思考本身 ",或者說探索復雜思維背後的心理過程。
" 我們的大腦是如何想出這些計劃和想法的?"Hassabis 問道。" 對我來說,比起我玩的遊戲,這背後的實際心理過程可能更令人着迷。"
Hassabis 在孩童時期第一次接觸編程是通過一台電子象棋計算機,這是一塊可以與人類棋手下棋的實體棋盤。盡管 Hassabis 打算在計算機上測試不同的象棋策略,但他更感興趣的是計算機的工作原理以及有人如何對其進行編程以使其下象棋。
" 我記得當時我被這樣一個事實所吸引:有人能對這塊無生命的塑料進行編程,讓它能夠和你下棋,而且下得非常好,"Hassabis 說。" 我對如何做到這一點以及有人如何編寫這樣的程式感到非常着迷。"
十幾歲的時候,Hassabis 就開始嘗試在早期的家用電腦 Amiga 500 上自己構建人工智能程式。從那時起,他就 " 迷上 " 了 AI,并決定用他的整個職業生涯來推動該領網域的進步。
2023 年 4 月,谷歌 Brain 宣布與 DeepMind 合并,統一歸由 Hassabis 領導,開啟了 Hassabis 帶領下的谷歌 AI 時代。
在此次訪談中,Hassabis 回憶道," 驅動我前進的,始終是對探索世界的熱情。我從小就痴迷于生命的意義、意識的本質、現實的本質等終極問題。我熱愛閱讀偉大科學家與哲學家對于這些問題的探索和思考。于我而言,推動人類知識進步的最佳工具就是 AI。"
Hassabis 表示,"AI 的發展速度着實驚人,我們正處于指數級進步的曲線之上。領網域内的成功吸引到大量關注、資源和人才,這又進一步推動了這種指數級增長。" 而在被問及 AGI 能否在未來五到十年内實現時,他的回答是 " 到 2030 年,我們将擁有能夠深度理解周遭一切的系統——比如嵌入日常生活的 Astra 眼鏡。"
Astra 項目進展
此次訪談中,Hassabis 展開聊了聊 DeepMind 的 Project Astra,它超越了文本的範疇。Astra 旨在實時解讀視覺世界。
Project Astra 是谷歌去年 5 月份在 Google I/O 大會上透露的一款實驗性萬能應用程式,本質上是一款類似于 Siri 和 Alexa 的智能助手。
Astra 使用 Gemini 2.0 的内置代理框架,通過文本、語音、影像和視頻來回答問題并執行任務,并在需要時調用現有的 Google 應用,例如搜索、地圖和智能鏡頭。" 它融合了我們這個時代一些最強大的信息檢索系統,"Astra 產品經理 Bibbo Shu 說道。
現在發展到什麼程度了?
《60 分鍾》欄目中播放了一段 Astra 演示視頻。
工作人員給 DeepMind 新近推出的 AI 應用 Astra 提了個難題,向它展示了幾幅虛拟畫作。在看到 Thomas Hart Benton 于 1942 年創作的《七月幹草》時,Astra 成功認出了作品并對人物情緒做出分析:" 畫面主體有種深思與内省的氛圍,隐隐傳遞出孤獨感。"
而在要求其圍繞 Edward Hopper 的《自助咖啡館》創作故事時,Astra 虛構了一位名叫 Eleanor 的女性,描繪了她憂郁與未竟的夢想。
當後續對故事中的虛構對話提出質疑時,Astra 回應稱:" 如果我創作的語氣有點無聊,我對此深表歉意。我的目标是保持專注交流。"
產品經理 Bibbo Shu 強調了 Astra 的獨特設計:一種能夠 " 看到、聽到和談論任何事物 " 的人工智能——這是邁向具體化人工智能系統的顯著一步。
但這些助手究竟将如何工作,又将如何使用它們?沒有人确切知道,就連 Hassabis 自己也說不準。
不過在去年 Google I/O 大會上,Hassabis 也透露,他看好手機和眼鏡作為這些智能助理的關鍵設備,但也表示 " 未來可能還會有更多令人興奮的形态 "。Astra 仍處于早期原型階段,它僅代表了用戶可能希望與 Gemini 等系統互動的一種方式。DeepMind 團隊仍在研究如何最好地整合多模态模型,以及如何在超大型通用模型與更小、更專注的模型之間取得平衡。
谷歌眼鏡将要回歸?
值得注意的是,此次訪談視頻中,《60 分鍾》 團隊試用了一款嵌入眼鏡的原型,演示了實時視覺識别和音頻響應。這是否也暗示着開創性但最終令人反感的早期 AR 眼鏡——谷歌眼鏡——即将回歸?
谷歌眼鏡最早于 2012 年推出,在當初那個大模型還沒有興起的時代,這款眼鏡經歷了曲折的發展過程後最終默默退出舞台。
2012 年 4 月 4 日,谷歌宣布 "Project Glass"。Glass 團隊表示,他們希望 " 開啟對話 ",并征求公眾對 Glass 未來發展方向的意見。谷歌還分享了一段視頻,這是一段早期的概念性演示,展示了 "Glass 能幫你做什麼 "。
2012 年 4 月 5 日:谷歌眼鏡公開亮相。羅伯特 · 斯科布爾分享了他和托馬斯 · 霍克以及謝爾蓋 · 布林的合影,後者戴着谷歌眼鏡出席了一場慈善晚宴。
2012 年 4 月 12 日:谷歌開始解答谷歌眼鏡發布後湧現的一些問題。設計師伊莎貝爾 · 奧爾森(Isabelle Olsson)回答了一個關于與處方眼鏡兼容性的常見問題:
我們理想中的 Project Glass 能夠适用于所有人,我們正在嘗試各種可擴展的設計,以适應不同類型的鏡架。我們的許多團隊成員也戴眼鏡,所以這絕對是我們正在考慮的事情。
她還分享了第一張 Glass 與個人眼鏡一起使用的照片:
2012 年 4 月 19 日:雖然谷歌眼鏡還遠未被谷歌以外的人佩戴,但一些谷歌眼鏡團隊成員正在日常生活中測試它。工程師塞巴斯蒂安 · 特倫分享了這張用 #throughglass 拍攝的電視主持人查理 · 羅斯的照片(但他沒有使用标籤!):
這是第一張已知的在現實世界中使用 Glass 拍攝的公開照片。
2012 年 6 月 27 日:谷歌聯合創始人謝爾蓋 · 布林(Sergey Brin)在舊金山舉行的谷歌 I/O 大會上午主題演講中,按計劃進行了一次打斷。維克 · 岡多特拉(Vic Gundotra)正在談論 Google+ 時,他跑上台,介紹了一群正在莫斯康尼中心上空進行跳傘的專業跳傘員,他們戴着谷歌眼鏡準備跳傘。他們真的跳傘了,整個過程在螢幕上直播,讓驚訝不已的主題演講觀眾們大呼過瘾。
演示結束後,谷歌開始接受 " 谷歌眼鏡探索者版 " 的預訂,售價 1500 美元。預訂僅在會議期間開放,且僅面向美國參會者。預計有 2000 人預訂,成為首批谷歌眼鏡探索者。
2012 年 7 月 25 日:谷歌分享了謝爾蓋 · 布林專門為 Glass Explorers 發來的私人消息,他在消息中表示,該團隊正處于 " 一段奇妙旅程的開始 ",并警告說 " 我不能保證這會很容易,也不能保證一切都會完美進行,但我可以保證這會很令人興奮。"
布林還分享了一張他最近在蒙大拿州戴着谷歌眼鏡開車時拍攝的照片,并表示他 " 正在測試谷歌眼鏡的一種新模式,該模式每 10 秒自動拍攝一張照片,不會受到任何幹擾或幹擾。"
2013 年 3 月 22 日:盡管谷歌眼鏡當時仍僅在谷歌内部使用,但 Explorer 項目距離正式發布也僅剩一個月左右的時間,西弗吉尼亞州卻成為美國首個提出禁止駕駛時佩戴谷歌眼鏡法案的州。這項名為 HB 3057 的法案将 " 在機動車上使用配備頭戴式顯示屏的可穿戴電腦構成犯罪 "。
沒過多久,又一張戴着谷歌眼鏡的照片引發外界熱議。
2013 年 4 月 28 日:探險家羅伯特 · 斯科布爾(Robert Scoble)發布了一張自己戴着谷歌眼鏡淋浴的照片,并聲稱這款設備在 " 完全浸溼 " 後仍能正常工作。這張照片迅速走紅,引起了全世界的關注——但并非全是正面評價。
因為人們擔心佩戴這款眼鏡,會被侵犯隐私。随後谷歌宣布,不會批準任何使用面部識别的 Glass 應用程式,并且 " 除非有強有力的隐私保護措施 "。
之後,谷歌眼鏡也陸續發布了一些更新,但并未引起太大的水花。最終,到了 2015 年,這款上市了僅 3 年的谷歌眼鏡在市場中昙花一現後悄然退役了。谷歌表示,Glass 将從公司秘密的 Google X 實驗室 " 畢業 ",轉入公司内部獨立團隊,并承諾未來版本的 Glass 将在某個時間點推出。
當時,坊間傳言稱,該項目将由蘋果 iPod 之父、Nest 創始人托尼 · 法德爾 ( Tony Fadell ) 接手,他于 2014 年加入谷歌。此後,谷歌眼鏡就沒再有下文了。
我們暫時還無法弄清谷歌是否會重新将 AR 眼鏡推向舞台,或許 Hassabis 也不會讓我們等太久。
最早在 2030 年實現 AGI?
Hassabis 的個人成長之旅始于國際象棋(12 歲時曾排名世界第二),後轉向神經科學與 AI。其團隊開發的 AlphaFold 項目成功破解了蛋白質結構,在一年之内解析了 2 億種結構類型,有望徹底颠覆藥物研發邏輯。他表示,"AI 能夠将藥物設計周期從十年縮短到幾個星期。治愈所有疾病的情況真的有可能在 10 年之内實現。"
随着 AGI 的步步臨近,Hassabis 設想出一個 "稀缺性徹底消失,資料極大豐富真正實現" 的新時代。但他也在思考更深層次的問題:" 當機器成為諾貝爾獎得主,人類還會有機會嗎?" 針對當下的情況,他呼籲各方協作,認為 " 需要有新一代哲學家站出來引領這場變革 "。
從 Hassabis 的視角出發,AI 的發展歷程可說是一曲包含指數級進步、深刻風險以及人類解讀自身存在本質這一永恒追求的復雜交響。展望未來,十年之内 AGI 很可能颠覆整個社會運行模式,而成功與否将取決于技術倫理的平衡與人類智慧的引導。
當被問及具體時間表時,Hassabis 預測通用人工智能最早可能在 2030 年實現,屆時系統将能夠 " 非常細致入微地 " 理解周圍環境。他表示,這樣的系統可以無縫融入日常生活,從可穿戴設備到家庭助理。
此外,本次采訪還探讨了人工智能擁有自我意識的可能性。Hassabis 表示,目前的系統尚不具備意識,但未來的模型可能會展現出自我理解的迹象。盡管如此,他還是強調了哲學和生物學上的分歧:即使機器能夠模仿意識行為,它們也不是像人類一樣由 " 柔軟的碳物質 " 構成的。
Hassabis 還預測了機器人技術的重大發展,并表示未來幾年可能會取得突破。
關注 AI 背後的能力與風險
但 AI 技術飛速發展的同時,Hassabis 也在擔心 AI 帶來的風險。
Hassabis 承認 AI 系統具有雙重性:" 它們能夠超越設計初衷完成驚人之舉,但問題在于如何确保其知識與人類價值觀相一致。"DeepMind 正在訓練其 Gemini 模型執行現實任務(如訂票、購物等),同時推進機器人技術發展。
他說:" 我最大的擔憂之一就是,對人工智能主導地位的争奪可能會演變成一場為了安全的逐底競争。" 他強調,主要參與者和國家需要在道德發展和監督方面進行協調。
Hassabis 就 AI 倫理問題提出了兩大風險:惡意人士濫用 AI 技術,以及自主系統的失控。他認為 " 安全護欄至關重要,目前對于 AI 主導權的争奪可能誘使某些參與者忽視安全。" 而在談到 AI 能否理解倫理道德時,他的答案是 " 可以,但需要配合大量示範與引導,就像培養孩子那樣。"
這場對話以對未來的沉思結束:一個 AI 工具幾乎可以改變人類所有活動的世界,并最終重塑我們對知識、意識甚至生命意義的思考。正如 Hassabis 所說:" 我們需要新的偉大哲學家出現……來理解這個系統的含義。"
參考鏈接:
https://venturebeat.com/ai/watch-google-deepmind-ceo-and-ai-nobel-winner-demis-hassabis-on-cbs-60-minutes/
https://www.youtube.com/watch?v=1XF-NG_35NE
https://glassalmanac.com/history-google-glass/2/
https://www.theverge.com/2024/5/14/24156296/google-ai-gemini-astra-assistant-live-io