今天小編分享的互聯網經驗:有視覺記憶的Agent、大變身的搜索、更強的AI全家桶和大一統的Gemini,歡迎閱讀。
今年的 Google Shoreline 圓形劇場 ,彌漫着一種前所未有的角鬥場般的氣息。
前一天 OpenAI 用 GPT-4o 和全新的 ChatGPT 把全世界掀翻,而 Google 要在今年甚至最近幾年最重要的一場 Google I/O 上做何應對,似乎成了唯一的主題。
事實上,據 OpenAI 的人士透露,GPT-4o 是一個至少兩年前就已經開始開發的模型,而矽谷 AI 圈子之小,互通有無之頻繁,其實不僅 OpenAI 有機會故意選在 Google 的大會前狙擊 Google,後者同樣也會對此有所預期。
所以,當 Pichai 走上舞台中央時,一場反狙擊開始了。
在這場持續兩小時的發布中,Google 有攻有守。
它對自己的看家業務搜索做了最徹底的一次 AI 化改造,還再次全面更新了 Gemini 模型家族。
守住 OpenAI 們猛攻的方向,同時發起進攻。
一方面很有火藥味的發布了效果超過 Sora 的模型 Veo,并且是可以立刻申請體驗的產品;另外還展示了與 GPT-4o 相似的語音視覺互動功能 Gemini Live,同時,還更進一步推出了比 OpenAI 等對手更激進的 AI 智能體 Project Astra。
以下為現場實錄。
Gemini,Gemini,還是 Gemini
當Google CEO Sundar Pichai走上台,在他的前幾分鍾講話裡,Gemini的頻率甚至超過了Google這個詞。
Gemini是去年Google I/O上正式推出的最核心的模型,而一年以後,Google已經用它完成了對自己内部的"大一統"。模型是Gemini,智能助手是Gemini,Android的核心是Gemini。甚至,Pichai都不叫自己Googler了,他們叫:
Geminier。
而當天大會上 Gemini 模型首先進行了更新。此前幾個月,Gemini 1.5 的長文本版本以預覽版本推出,今天它正式對所有人發布。此前的 Gemini 1.5 版本上下文長度為 100 萬 token。而 Pichai 似乎輕描淡寫的公布:
新版本長度再次刷新,達到 200 萬 token。
現場的開發者爆發出當天的第一陣歡呼。
" 我們正式進入了 Gemini 時代。"Pichai 直入主題說。目前有超過 1500 萬開發者在使用 Gemini 做開發。而 Gemini 最近三個月時間達到了 100 萬訂閱用戶。
關于 Gemini 的具體信息,自然是由 Deepmind 的 CEO Demis Hassabis 來講。這也是這位傳奇人物第一次 Google I/O 演講。
在他的演講中,第一個發布是 Gemini 1.5 flash。這是一個針對端側的模型,同樣有 100 萬和 200 萬 token 的版本。這似乎指向了 Google 接下來對端側的野心。
排排隊
" 我們總有很多模型同時在訓練,我們會用我們最強的模型來幫助小模型。"
而對于此前推出的單獨版本的 Gemini App,Google 也做了更新,推出了更高級别的訂閱服務 Gemini Advanced。也就是對标 ChatGPT Plus 的最高級别服務。
在這個服務裡,一個新的功能看起來正是對昨天 ChatGPT 的更新的回應—— Gemini Live。你可以在 Gemini 裡實時無延遲的打電話來與 AI 互動,也就是 GPT-4o 昨天做的事情。遺憾的是這部分只是一帶而過,看起來 Google 更多是想說,哪怕晚一天,也要告訴世界,不是只有你能做。
不過現場似乎對此略顯失望,人們顯然希望看到更多針尖對麥芒的發布。
有視覺記憶的 AI Agent
于是,大的來了。
一個充滿野心的 AI Agent。
面對 OpenAI 的進攻,不能只是防守。Google 也需要一些更加激進的東西來反擊。這個東西就是 Project Astra。這是一個還在研發中的 AI Agent,而 Pichai 形容 Google 的夢想一直就是做出一個強大的 AI Agent。
Google Deepmind CEO Hassabis 親自上台,講解和展示了 Astra 的一個原型的運作視頻。
是的,我故意拍的一個意味深長的交接
在展示中,一開始一切都和我們見過的 AI Agent 差不多,可以通過用戶打開的攝像頭識别物體,與用戶實時語音互動。而驚人的一刻在最後到來,當用戶帶着 Astra 走了一大圈後,突然提出一個此前沒有涉及到的問題:
" 你記得我把眼鏡放哪了麼?"
這是此前沒有詢問的問題,但攝像頭掃過的時候 Astra 曾 " 看 " 到過他的眼鏡,而 AI Agent 居然以視覺的形式記錄了下來。
" 你的眼鏡在桌上蘋果旁邊。"Astra 回答道。
這讓現場一陣驚呼,也是此次發布會上最長的一次掌聲。
此外,Google 還明顯針對 Sora 做了一次進攻。發布了一款全新的視覺模型,Voe。這是 Google 過往許多視覺模型的集大成者,也可以看作 Sora 逼迫下的一次内部資源整合。
在 Voe 的展示中,用戶可以通過點擊擴展,而繼續增加視頻生成的時長,這讓它可以超過了 Sora 一開始的 1 分鍾,并且可以保持一致性。
Google 還着重展示了他們開發這些產品過程裡與藝術家的合作。似乎也在隔空喊話那些對 Sora 不滿的藝術家,來這裡來這裡,我更好。
終于對搜索下手:Google 搜索最大的一次改造
除了對 OpenAI 的進攻的反應,人們也關心一件事:Google 的搜索改造的怎麼樣了。
Google 什麼時候對搜索下手,是所有人期待的那個重要時刻。OpenAI 此前的煙霧彈,Perplexity 不停的碰瓷,都讓 Google 一直顯得太過安靜。而這一次終于有了最大的一次更新和變化。
當數億美國用戶今天打開 Google 時,他們将看到近幾年最大變化的 Google。
AI overview,也就是 AI 生成的搜索答案總結,會出現在所有人的搜索框下。
而且,這個總結并不是一個固定的模版,而是根據你的問題進行調整。
比如,Google 可以根據你的問題幫你做規劃。這時候在搜索框下,會顯示正在進行的步驟,然後在 Overview 裡展示給你不同卡片,把需要的信息整理出來提供給你。
Google 表示這是必須有強大的實時搜索才能做的,言外之意,那些沒有搜索能力基礎的公司,就别來碰瓷了。
而搜索的改造也只是個開始,它看起來很像是要變成 Google 激發用戶 AI 需求的一個超級入口。
比如 Google 展示了一個場景,當用戶哪怕不知道自己該具體問什麼的時候,Google 也可以給你推薦,與你做頭腦風暴。而此時這個搜索的界面也進一步完全變成了另一個樣子。像是不同卡片的信息流,每一個都可以進一步操作。
"Google 會替你 Google。" 這是 Pichai 對此的定義。
更進一步,Google 還展示了一個用實時視頻對話來搜索的功能。而這也是全場進行了半小時後的第一次 Live demo 的環節。
現場一度過于安靜,人們等待 Live demo,這個小車帶着一台電腦被推上來時,大家騷動了一下
當你買了一台唱片播放器,但你對此毫無了解,它出了播放問題,但你不知道問題到底在哪裡的時候,你可以直接打開攝像頭拍攝并詢問。
而 Google 直接給出了 AI 整理的答案和解決建議。
" 這就是 Gemeni 時代的搜索。"Pichai 說。現場掌聲再次響起。
對全家桶的 AI 能力進一步改造更新
Google I/O 上的保留節目是對全家桶的新功能展示。而 Gemini 時代來了,這些全家桶也自然要更新。
Pichai 在當天展示的第一個應用案例,是 "Ask Photo"。9 年前,Google Photo 發布。每天有 60 億的照片視頻上傳。Gemini 讓 AI 編輯更簡單。
你現在可以 ask photo,與照片進行對話。比如,你可以問 Photo app," 我的汽車牌照是多少 "。然後 Gemini 就在照片裡尋找出來你的車告訴你答案。
或者你可以詢問 Photo," 我女兒是什麼時候學會遊泳的 ",然後還可以進一步詢問," 她的進步是怎樣的 "。Photo 都可以把對應的照片和視頻給你展示出來。這對于每天都抱着手機看自己寶貝孩子成長歷程的人們來說,實在是太有用了。
這個功能的展示也讓全場一陣歡呼。
此外 Workspace 也有了很多新功能,Google 還展示了一個基于多模态能力的教學工具,你可以用語音提出教學要求,比如 " 給我一個用籃球解釋力學原理的案例 ",Motion 就會自動用很自然的語音講出來。
另一個讓現場觀眾眼前一亮的功能,是 Android 對 Gemnini 的使用。現場展示的一個 live demo 中,一個詐騙電話打來,像我們經常遇到的電話那樣,在一通義正嚴辭的提醒後,對方要求你把錢轉到一個安全的賬戶。
而就在這句話說出來時,Gemini 被激發了,直接彈出一個警告框,阻止了電話的繼續進行。
全場響起可能是當天第二長的一次歡呼。
在發布會的最後,Pichai 做最後總結時開玩笑說,肯定有人在數,我今天說了多少次 AI。
" 不用數了,Gemini 數完了。"
然後大螢幕顯示 120。
" 我說了這麼多次 AI。"
然後 Gemini 又加了 1,變成了 121。
現場都笑了。
很明顯,Google 依然正在一個整合資源的過程裡。無論是對全家桶的能力提升,還是對搜索的改造,背後都是一個邏輯,要把 Google 這麼多年積累下來的能力和資源用起來,由 Gemini 來做唯一的大腦,改造一切,守住并繼續搶奪新的用戶。
Google 不會輕易下牌桌,AI 大戰會繼續進行下去。