大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 互联网

有视觉记忆的Agent、大变身的搜索、更强的AI全家桶和大一统的Gemini

2024-05-15 简体 HK SG TW

今天小编分享的互联网经验:有视觉记忆的Agent、大变身的搜索、更强的AI全家桶和大一统的Gemini,欢迎阅读。

今年的 Google Shoreline 圆形剧场  ,弥漫着一种前所未有的角斗场般的气息。

前一天 OpenAI 用 GPT-4o 和全新的 ChatGPT 把全世界掀翻,而 Google 要在今年甚至最近几年最重要的一场 Google I/O 上做何应对,似乎成了唯一的主题。 

事实上,据 OpenAI 的人士透露,GPT-4o 是一个至少两年前就已经开始开发的模型,而硅谷 AI 圈子之小,互通有无之频繁,其实不仅 OpenAI 有机会故意选在 Google 的大会前狙击 Google,后者同样也会对此有所预期。

所以,当 Pichai 走上舞台中央时,一场反狙击开始了。 

在这场持续两小时的发布中,Google 有攻有守。 

它对自己的看家业务搜索做了最彻底的一次 AI 化改造,还再次全面更新了 Gemini 模型家族。 

守住 OpenAI 们猛攻的方向,同时发起进攻。 

一方面很有火药味的发布了效果超过 Sora 的模型 Veo,并且是可以立刻申请体验的产品;另外还展示了与 GPT-4o 相似的语音视觉互動功能 Gemini Live,同时,还更进一步推出了比 OpenAI 等对手更激进的 AI 智能体 Project Astra。 

以下为现场实录。

Gemini,Gemini,还是 Gemini

当Google CEO Sundar Pichai走上台,在他的前几分钟讲话里,Gemini的频率甚至超过了Google这个词。

Gemini是去年Google I/O上正式推出的最核心的模型,而一年以后,Google已经用它完成了对自己内部的"大一统"。模型是Gemini,智能助手是Gemini,Android的核心是Gemini。甚至,Pichai都不叫自己Googler了,他们叫:

Geminier。

而当天大会上 Gemini 模型首先进行了更新。此前几个月,Gemini 1.5 的长文本版本以预览版本推出,今天它正式对所有人发布。此前的 Gemini 1.5 版本上下文长度为 100 万 token。而 Pichai 似乎轻描淡写的公布:

新版本长度再次刷新,达到 200 万 token。

现场的开发者爆发出当天的第一阵欢呼。

" 我们正式进入了 Gemini 时代。"Pichai 直入主题说。目前有超过 1500 万开发者在使用 Gemini 做开发。而 Gemini 最近三个月时间达到了 100 万订阅用户。

关于 Gemini 的具体信息,自然是由 Deepmind 的 CEO Demis   Hassabis 来讲。这也是这位传奇人物第一次 Google I/O 演讲。

在他的演讲中,第一个发布是 Gemini 1.5 flash。这是一个针对端侧的模型,同样有 100 万和 200 万 token 的版本。这似乎指向了 Google 接下来对端侧的野心。

排排队

" 我们总有很多模型同时在训练,我们会用我们最强的模型来帮助小模型。"

而对于此前推出的单独版本的 Gemini App,Google 也做了更新,推出了更高级别的订阅服务 Gemini Advanced。也就是对标 ChatGPT Plus 的最高级别服务。

在这个服务里,一个新的功能看起来正是对昨天 ChatGPT 的更新的回应—— Gemini Live。你可以在 Gemini 里实时无延迟的打电话来与 AI 互动,也就是 GPT-4o 昨天做的事情。遗憾的是这部分只是一带而过,看起来 Google 更多是想说,哪怕晚一天,也要告诉世界,不是只有你能做。 

不过现场似乎对此略显失望,人们显然希望看到更多针尖对麦芒的发布。

有视觉记忆的 AI Agent

于是,大的来了。

一个充满野心的 AI Agent。

面对 OpenAI 的进攻,不能只是防守。Google 也需要一些更加激进的东西来反击。这个东西就是 Project Astra。这是一个还在研发中的 AI Agent,而 Pichai 形容 Google 的梦想一直就是做出一个强大的 AI Agent。

Google Deepmind CEO   Hassabis 亲自上台,讲解和展示了 Astra 的一个原型的运作视频。

是的,我故意拍的一个意味深长的交接

在展示中,一开始一切都和我们见过的 AI Agent 差不多,可以通过用户打开的摄像头识别物体,与用户实时语音互動。而惊人的一刻在最后到来,当用户带着 Astra 走了一大圈后,突然提出一个此前没有涉及到的问题:

" 你记得我把眼镜放哪了么?"

这是此前没有询问的问题,但摄像头扫过的时候 Astra 曾 " 看 " 到过他的眼镜,而 AI Agent 居然以视觉的形式记录了下来。

" 你的眼镜在桌上苹果旁边。"Astra 回答道。

这让现场一阵惊呼,也是此次发布会上最长的一次掌声。

此外,Google 还明显针对 Sora 做了一次进攻。发布了一款全新的视觉模型,Voe。这是 Google 过往许多视觉模型的集大成者,也可以看作 Sora 逼迫下的一次内部资源整合。

在 Voe 的展示中,用户可以通过点击扩展,而继续增加视频生成的时长,这让它可以超过了 Sora 一开始的 1 分钟,并且可以保持一致性。

Google 还着重展示了他们开发这些产品过程里与艺术家的合作。似乎也在隔空喊话那些对 Sora 不满的艺术家,来这里来这里,我更好。

终于对搜索下手:Google 搜索最大的一次改造

除了对 OpenAI 的进攻的反应,人们也关心一件事:Google 的搜索改造的怎么样了。

Google 什么时候对搜索下手,是所有人期待的那个重要时刻。OpenAI 此前的烟雾弹,Perplexity 不停的碰瓷,都让 Google 一直显得太过安静。而这一次终于有了最大的一次更新和变化。

当数亿美国用户今天打开 Google 时,他们将看到近几年最大变化的 Google。

AI overview,也就是 AI 生成的搜索答案总结,会出现在所有人的搜索框下。

而且,这个总结并不是一个固定的模版,而是根据你的问题进行调整。

比如,Google 可以根据你的问题帮你做规划。这时候在搜索框下,会显示正在进行的步骤,然后在 Overview 里展示给你不同卡片,把需要的信息整理出来提供给你。

Google 表示这是必须有强大的实时搜索才能做的,言外之意,那些没有搜索能力基础的公司,就别来碰瓷了。

而搜索的改造也只是个开始,它看起来很像是要变成 Google 激发用户 AI 需求的一个超级入口。

比如 Google 展示了一个场景,当用户哪怕不知道自己该具体问什么的时候,Google 也可以给你推荐,与你做头腦风暴。而此时这个搜索的界面也进一步完全变成了另一个样子。像是不同卡片的信息流,每一个都可以进一步操作。

"Google 会替你 Google。" 这是 Pichai 对此的定义。

更进一步,Google 还展示了一个用实时视频对话来搜索的功能。而这也是全场进行了半小时后的第一次 Live demo 的环节。

现场一度过于安静,人们等待 Live demo,这个小车带着一台电腦被推上来时,大家骚动了一下

当你买了一台唱片播放器,但你对此毫无了解,它出了播放问题,但你不知道问题到底在哪里的时候,你可以直接打开摄像头拍摄并询问。

而 Google 直接给出了 AI 整理的答案和解决建议。

" 这就是 Gemeni 时代的搜索。"Pichai 说。现场掌声再次响起。

对全家桶的 AI 能力进一步改造更新

Google I/O 上的保留节目是对全家桶的新功能展示。而 Gemini 时代来了,这些全家桶也自然要更新。

Pichai 在当天展示的第一个应用案例,是 "Ask Photo"。9 年前,Google Photo 发布。每天有 60 亿的照片视频上传。Gemini 让 AI 编辑更简单。

你现在可以 ask photo,与照片进行对话。比如,你可以问 Photo app," 我的汽车牌照是多少 "。然后 Gemini 就在照片里寻找出来你的车告诉你答案。

或者你可以询问 Photo," 我女儿是什么时候学会游泳的 ",然后还可以进一步询问," 她的进步是怎样的 "。Photo 都可以把对应的照片和视频给你展示出来。这对于每天都抱着手机看自己宝贝孩子成长历程的人们来说,实在是太有用了。

这个功能的展示也让全场一阵欢呼。

此外 Workspace 也有了很多新功能,Google 还展示了一个基于多模态能力的教学工具,你可以用语音提出教学要求,比如 " 给我一个用篮球解释力学原理的案例 ",Motion 就会自动用很自然的语音讲出来。

另一个让现场观众眼前一亮的功能,是 Android 对 Gemnini 的使用。现场展示的一个 live demo 中,一个诈骗电话打来,像我们经常遇到的电话那样,在一通义正严辞的提醒后,对方要求你把钱转到一个安全的账户。

而就在这句话说出来时,Gemini 被激发了,直接弹出一个警告框,阻止了电话的继续进行。

全场响起可能是当天第二长的一次欢呼。

在发布会的最后,Pichai 做最后总结时开玩笑说,肯定有人在数,我今天说了多少次 AI。

" 不用数了,Gemini 数完了。"

然后大螢幕显示 120。

" 我说了这么多次 AI。"

然后 Gemini 又加了 1,变成了 121。

现场都笑了。

很明显,Google 依然正在一个整合资源的过程里。无论是对全家桶的能力提升,还是对搜索的改造,背后都是一个逻辑,要把 Google 这么多年积累下来的能力和资源用起来,由 Gemini 来做唯一的大腦,改造一切,守住并继续抢夺新的用户。

Google 不会轻易下牌桌,AI 大战会继续进行下去。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們