大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

手握 Andorid 和搜索,谷歌 AI 更看重如何落地

2024-05-15 简体 HK SG TW

今天小編分享的互聯網經驗:手握 Andorid 和搜索,谷歌 AI 更看重如何落地,歡迎閱讀。

文 | 極客公園 GeekPark

不出預料,谷歌是被 OpenAI 狙擊了。

一連串煙霧彈後,昨天 OpenAI 用一個可以看到、聽到真實世界,并可以實時無延遲對話的 AI 智能助手「GPT-4o」震撼了世界。而把發布 4o 的時間點特别選在谷歌 I/O 大會開幕前一天,當時就有媒體預測,OpenAI 這是在狙擊谷歌。

果不其然,美國當地時間 14 日上午 10 點舉行的谷歌 I/O 大會主題演講上,雖然谷歌發布了一系列基于 Gemini 的「AI 全家桶」——包括更新 200 萬 tokens 上下文的 Gemini 1.5 Pro、新模型 Gemini 1.5 flash、類 Sora 的新視頻大模型   Veo,以及包括 AI 搜索、AI + Gmail 在内的多個 AI 應用。

但最受關注的,還是谷歌 DeepMind 負責人兼谷歌 AI 領導者 Demis Hassabis 口中,真正通向 AGI 的萬能助手項目——「Project Astra」。以及面向 Gemini Advanced 訂閱者新推出的語音聊天功能 Live,後者預計還将在年内加入相機功能,讓 AI 可以基于用戶所處的真實環境展開對話。

這兩個產品都有點像「GPT-4o」,但先不論三者的真實效果到底如何,從產品進展來看 OpenAI 已經領先一籌。不過這也不意味着 OpenAI 注定成為最後的赢家,目前來看手機依然是這些超級智能助手最重要的硬體載體,掌握安卓系統的谷歌有着天然的優勢。從這個角度看,前段時間蘋果與 OpenAI 的合作傳聞,可能正是來源于二者對抗谷歌因而各取所需。

不論如何,具備「真實世界感知 Input」+「低延遲語音 Output」的超級智能助手,已經成為下一階段 AI 公司軍備競賽的關鍵。接下來更多大模型公司、雲計算平台,甚至手機公司、AI 應用開發者都會卷入其中。

Project Astra ——實時視頻問答,發誓沒有造假

I/O 大會上,谷歌發了一段非常驚豔的 AI 助手演示視頻,這次還了發誓,沒有以任何方式偽造或篡改。

Demis Hassabis 說,Project Astra 是自己期待了幾十年的 AI 助手的雛形,是 AI 助手的未來。

Project Astra 是一個實時、多模式的人工智能助手,通過接收信息、記住它所看到的内容、處理該信息和理解上下文細節來與周圍的世界進行互動,它的語音互動比當前形式的 Google Assistant 更自然,沒有延遲或延遲,可以回答問題或幫助你做幾乎任何事情。

演示視頻中,用戶要求 Project Astra 在看到發出聲音的東西時告訴她,助手回答說,它可以看到一個發出聲音的揚聲器。

互動是實時語音進行的,且并沒有「嘿,Google、Gemini」等喚起詞,用戶問 Project Astra 視頻中顯示器上的代碼有什麼作用,Project Astra 沒有一絲延遲地進行了解釋。

Project Astra 記住了一閃而過的眼鏡 | 圖片來源:谷歌

Project Astra 關于視覺的處理甚至算整場發布會最大的亮點。「你記得我把眼睛放哪了嗎?」「你的眼鏡在桌子上的紅蘋果旁邊。」Project Astra 甚至通過鏡頭記住了一閃而過的眼鏡,并準确回答出在蘋果旁。這裡可能夾帶了一點「私貨」,這副眼鏡上或許也有 Project Astra。

從演示看,Project Astra 可以很快處理收到的信息,可以通過連續編碼視頻幀并将視頻和語音組合成事件時間線來做到這一點,然後緩存信息以供回憶。谷歌表示,其中一些功能将在今年晚些時候添加到 Gemini 應用程式和其他產品中。

Project Astra 給這個樂隊起名為金色條紋 | 圖片來源:谷歌

谷歌稱 DeepMind 團隊還在研究如何最好地将多模态模型整合在一起,以及如何平衡超大型通用模型與更小、更集中的模型。

昨天剛發布 GPT-4o 的 OpenAI 最重大的突破也在多模态上,看下來似乎昨日重現。最大的一個區别在視覺處理上,是目前 GPT-4o 只能處理靜态影像,Astra 已經可以處理視頻。

Project Astra 背後的 Gemini 系列大模型能力也有更新。上個月舉辦的 Google Cloud Next 2024 大會上發布,發布的 Gemini 1.5 Pro,具有原生音頻理解、系統指令、JSON 模式等,可提供 100 萬長文本能力,宣布已經向全球開發者開放。

這次宣布推出的 Gemini 1.5 Flash 模型,解決了關鍵的成本問題。Gemini 1.5 Flash 介于 Gemini 1.5 Pro 和 Gemini 1.5 Nano 之間,主要面向開發者。會上詳細介紹了 Gemini 1.5 Pro 和 Flash 的定價。Gemini 1.5 Flash 的價格定為每 100 萬個 token 35 美分,這比 GPT-4o 的每 100 萬個 token 5 美元的價格要便宜得多。

Gemini 1.5 Flash| 圖片來源:極客公園

谷歌還預告了接下來的動作,宣布今年晚些時候将模型的現有上下文視窗增加一倍,達到 200 萬個 token。這将使其能夠同時處理 2 小時的視頻、22 小時的音頻、超過 60,000 行代碼或超過 140 萬個單詞。

Gemini 1.5 Pro | 圖片來源:極客公園

谷歌去年 12 月發布的一個預錄演示遭到「造假」質疑,通過剪輯誤導人們高估 Gemini 的視頻處理能力,不過現在,這些能力都是真的了。

基于大模型的 AI 應用生态方面的進展

在這次 I/O 大會上,谷歌基于大模型的 AI 應用生态也有所更新,涵蓋搜索、照片、創作、工具以及工作應用等方方面面。

搜索是谷歌 25 年前的創世產品。在一年前,谷歌表示,搜索的未來是 AI。現在,谷歌搜索中的 AI 真的來了,主打一個——「讓谷歌幫你谷歌。」

谷歌首席執行官桑達爾 · 皮查伊(Sundar Pichai)在 I/O 大會上宣布,人工智能生成的搜索摘要,現在被稱為「人工智能概述」,将在「本周」向美國的所有人推出,更多國家 / 地區即将推出。

相比從前,AI 搜索可以處理更復雜的問題。谷歌提供了一個例子,也許用戶在尋找一個新的瑜伽工作室,要求這個工作室既要在當地很受歡迎,也要方便通勤,還要有折扣,只需一次搜索就能實現。

另外,用戶還可以調整已經生成的 AI 摘要,或者選擇簡化版本,或者選擇查看更多細節。

這一切是谷歌通過定制的 Gemini 模型來實現的,其将多步推理、規劃和多模态與搜索系統結合,總結網絡内容并展示答案,據稱還是 AI 來設計和填充結果頁面。

但一個問題是,如果是 AI 為用戶捕獲搜索結果,谷歌的競價廣告業務往哪放?

據谷歌高管稱,與傳統查詢出的網頁列表相比,AI 摘要中包含的鏈接會獲得更多點擊。「與以往一樣,廣告将繼續出現在頁面的專用位置上,并通過清晰的标籤區分有機結果和贊助結果。」

除了提問,谷歌 AI 搜索還能制定計劃,從飲食到旅行計劃,比如搜索「創建一個容易準備的團體 3 天飲食計劃」,AI 就會定制計劃,然後用戶可以将某份晚餐調整成素食,随後導出到文檔或者谷歌郵箱裡。

搜索還不僅僅是文本框中的文字,谷歌的視覺搜索也進化了,可以用視頻提問。比如,用戶有台二手唱片機,上面帶針的金屬部件漂移了,不知道怎麼回事,可以直接用視頻搜索,即能得到有解決步驟的 AI 摘要和相關鏈接,省去描述問題所需要的正确術語的時間和麻煩。

使用谷歌 AI 搜索,直接制定飲食計劃 |圖片來源:谷歌

谷歌照片應用也将進化。桑達爾 · 皮查伊在演示中稱,9 年前他們推出了這個應用,現在每天有超過 60 億張照片和視頻被上傳到這裡。

該應用在未來幾個月将推出「詢問照片(Ask Photos)」功能,也是基于 Gemini 模型,可以讓用戶以自然語言搜索照片和視頻中的人物、寵物、地點等,它能理解照片的上下文和主題,找到特定的回憶信息,無需滑動螢幕。

例如,「向我展示我參觀過的每個國家公園的最好看的照片」「去年我在哪裡露營?」「我的優惠券什麼時候到期?」「露西娅什麼時候學會遊泳的?」「顯示露西娅的遊泳進步情況」「莉娜的生日派對是什麼主題?」最後,它還能撰寫旅行亮點或者個性化的标題,供用戶在社交媒體上分享。

谷歌還稱,「除非在極少數情況下是為了解決虐待或傷害問題,我們不會使用這些個人數據訓練 Google Photos 之外的任何生成式 AI 產品,包括其他 Gemini 模型和產品。」

使用詢問照片功能,詢問生日派對細節|圖片來源:谷歌

在創作工具方面,谷歌在 I/O 大會上還推出了 AI 生成視頻的工具 VideoFX,并更新了 AI 影像和 AI 音樂創作工具 ImageFX 和 MusicFX。

VideoFX 可以讓電影制作人編寫提示來構建電影鏡頭,ImageFX 添加了影像編輯控件,而 MusicFX 出了一個新的 DJ 模式。

其中,新工具 VideoFX 由 Veo 提供動力,Veo 是谷歌 DeepMind 最強的生成式視頻模型。這個新工具配備了一個故事板模式,可以逐個場景地進行迭代,并向最終視頻添加音樂。

據谷歌高管稱,Veo 能理解「延時拍攝」等電影術語,可以生成各種電影和視覺風格的 1080p 分辨率視頻,時間還可以超過一分鍾。Veo 将通過候補名單提供預覽版。

另外值得注意的是,VideoFX、ImageFX 和 MusicFX 生成的所有内容都被數字水印   SynthID   标記,主要是為了防止 AI 内容濫用和虛假信息傳播問題。

使用谷歌 AI 生成視頻工具 VideoFX |圖片來源:谷歌

除了創作工具,谷歌日常工作應用的進化也值得關注。包括 Gmail 郵箱、日歷、文檔、表格、幻燈片、雲端硬碟等在内谷歌   Workspace   應用,将引入最新的 AI 模型 Gemini 1.5 Pro,位于側邊欄,作為一個虛拟助手。

當用戶點擊側邊欄的 Gemini 圖示時,Gmail 中的 Gemini 将提供「總結此電子郵件」「列出下一步操作」「建議回復」等選項。用戶可以讓它總結小孩學校的郵件,獲得需要行動的信息,起草回復。

Gmail 側面板中的 Gemini 總結電子郵件 |圖片來源:谷歌

另外,在昨天 OpenAI 發布的 GPT-4o 演示中,其中有個教育場景,GPT-4o 直接化身家教,逐步教一個青少年解決幾何數學問題。

谷歌也宣布推出 LearnLM,這是一組基于 Gemini 的微調模型,專為學習教育而設計,同時演示了一些在搜索、YouTube 應用上的 AI 教育學習場景。

比如,在 YouTube 上,用戶可以在觀看視頻時提問,也可以針對視頻提後續問題。在 Android 上,可以用畫圈搜索(Circle to Search)嘗試解決數學和物理題目裡的特定困難。

針對 YouTube 學習視頻進行提問 |圖片來源:谷歌

在這場 AI 公司的軍備競賽中,谷歌追趕 OpenAI 的其中一大優勢「老本」,在于其掌握手機安卓系統,以及龐大的應用生态。

但當生成式 AI 真的全方位進入谷歌的生态應用,直接接管搜索,幫人回憶過去,制定出行計劃,取代真人家教等等,其準确性是否真的可靠?我們拭目以待。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們