大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 互联网

继续对着OpenAI来,Google发布Veo 2、Imagen 3,Sora和DALL-E不香了

2024-12-18 简体 HK SG TW

今天小编分享的互联网经验:继续对着OpenAI来,Google发布Veo 2、Imagen 3,Sora和DALL-E不香了,欢迎阅读。

新的一周,OpenAI 技术直播迎来了第 8 天。今日重点是 ChatGPT Search,从领衔登场的熟面孔、公司首席产品官 Kevin Weil 来看,这次发布仍以优化和完善产品功能为主。

与此同时,Google 却在发布 Gemini 2.0 Flash 后继续在模型上发力,一口气推出新一代视频生成模型 Veo 2 和图片生成模型 Imagen 3,还上线了一个可玩性很高的 " 图生图 " 实验项目 Whisk。

即便已近年尾,OpenAI 和 Google 这对老冤家依然打得火热。而从社区反响来看,今天似乎又成了一个 "Google 主场日 "。

ChatGPT 搜索集成地图,全球免费开放

OpenAI 今天主要带来三项 AI 搜索更新:

1. 搜索功能优化

ChatGPT 根据用户反馈全面提升了搜索体验,包括提升搜索速度、移动端增强和引入新的地图功能等。

• 视觉效果更丰富:

搜索结果现在支持更丰富的视觉元素和结构化信息展示。例如搜索 " 旧金山周末有趣的活动 " 时,系统会同时展示活动图片、来源链接及详细信息,让结果更加直观。用户还能直接在搜索结果中观看视频内容,不过这些并不稀奇,在 Perplexity 中早已实现过了。

• 移动端新增地图功能:

新增「地图」查看模式,支持用户通过 ChatGPT 应用直接与地图互動,也是此次更新的最大亮点。以搜索 Mission 区墨西哥餐厅为例,点击地图上的圖示即可查看餐厅图片、营业时间、露台信息及导航路径等详情。

• 默认搜索引擎的快速导航:将 ChatGPT 设为浏览器默认搜索引擎后,无需打开网站,通过在地址栏直接输入查询内容,即可快速调用 ChatGPT 并获取推荐链接。

2. 搜索功能集成高级语音模式

搜索功能已整合至高级语音模式中,支持边聊天边搜索的自然互動体验。

3. 全球免费开放

最后团队宣布,GPT 搜索功能现已向所有登录的免费用户开放。用户只需登录账户即可在全球范围内的各种平台上无需付费,享受这一增强搜索体验。

Veo 2 与 Imagen 3 齐发,加推创意工具 Whisk

来到 Google 这边,直接给视频和影像生成技术来了个大更新,推出三款重磅产品:

全新视频生成模型Veo 2、更新版影像生成模型Imagen 3,以及创意实验项目Whisk。

Veo 2 重塑 AI 视频生成:质量与控制力双突破

Google 最新发布的 Veo 2 在 AI 视频生成领網域取得突破性进展。无论真实感、运动表现能力,还是镜头控制都达到当之无愧的 SOTA 水平。不少人在看过惊艳的官方示例后表示,SORA 瞬间就不香了。

核心亮点有:

1. 高质量与真实感

Veo 2 在细节呈现、视觉风格和减少瑕疵方面表现出色,能够生成高达4K 分辨率的视频,且时长可达数分钟,适用于广泛的场景和风格。

2. 物理与人类动态理解

Veo 2 对真实世界物理原理以及人类动作与表情的细微之处有着深刻理解,显著提升了视频的真实感与自然度。

例如示例中这位穿着暗黄色防护服的科学家。冷白色实验室灯光下,她神情焦虑地调试显微镜,担忧的神情清晰可见,渲染出沉重压力的氛围。

以及下方,枫糖浆缓缓淋在松软的煎饼上,培根油脂细腻,咖啡倒入玻璃杯中冲出层次丰富的泡沫,都展示出媲美物理世界,真实诱人的画面细节。

3. 精确的镜头控制

Veo 2 深谙电影语言,支持丰富的指令细节:

• 指定风格与镜头(如 "18mm 镜头 " 生成广角效果)

• 提供电影效果(如 " 浅景深 " 聚焦主体,虚化背景)

• 精确的动态镜头控制,如低角度跟踪镜头、特写镜头等。比如镜头跟随下在马路快速漂移的汽车:

4. 减少 " 幻觉 " 现象

相较于其他视频生成模型,Veo 2 在生成过程中更少出现多余的细节或 " 额外的手指 " 这类意外物体,确保输出结果更加真实可靠。

基准表现:

在实际应用评测中,通过 Meta 发布的 MovieGenBench 基准数据集的 1003 组提示词测试,Veo 2 在人工评估中全面超越其他领先的视频生成模型。特别是在以下两个关键指标上表现突出:

• 整体偏好度评分最高

• 提示词执行准确度领先

现有局限:

尽管表现优异,Veo 2 在处理高度动态或复杂场景时仍面临挑战,特别是在整个视频中保持完全一致性方面还有提升空间。Google 团队表示将持续优化性能,逐步克服这些难题。

所有 Veo 2 生成的视频均包含 SynthID 不可见水印,用于标识其为 AI 生成,减少误导和误用风险。

目前,Veo 2 的新功能已在 Google Labs 视频生成工具VideoFX开放,用户可前往 Google Labs 申请加入候补名单。未来,Veo 2 计划进一步集成到 YouTube Shorts 等产品中,持续推动 AI 视频生成技术的发展。

Imagen 3:极致细节与风格多样性的影像生成革新

更新后的 Imagen 3 在影像质量、细节呈现、风格多样性和文字渲染方面取得了显著提升,全面超越前代模型和其他领先竞品,成为文本到影像生成领網域的新标杆。

核心技术突破:

1. 高清细节的优质影像

Imagen 3 生成的影像具备丰富的细节、更明亮自然的光影效果和更专业的构图水平,有效捕捉如皮肤质感、手部细微皱纹、编织玩偶针线等复杂纹理与微小细节,同时减少视觉瑕疵,呈现更加自然精致的高保真体验。

手部皮肤和陶土质感

动物皮毛纹理细节

2. 风格表现力增强

新版本在艺术风格的驾驭上实现跨越式发展,涵盖范围广泛,能满足不同创作者的需求:

• 写实风格:如风景摄影、人物肖像。

人物肖像

空中的千纸鹤

• 各种艺术风格:印象派油画、动漫、抽象画、黏土动画等。

黏土动画

动漫风格

油画风格

3. 提示词理解深化

Imagen 3 对自然语言提示的理解能力大幅提升,无需复杂的提示词工程即可准确执行用户意图。模型通过更丰富的训练数据标注,能准确理解长提示词中的复杂细节,并准确呈现指定的镜头角度、构图等元素。

4. 强大的文本渲染能力

AI 作图此前的一大难点就是乱码和错字。如今 Imagen 3 显著增强了文本渲染的准确性,也为风格化卡片、海报等应用场景提供了更多可能。

在严格的人工评估中,Imagen 3 在视觉质量、提示词执行准确度和用户偏好度等关键指标上均创造新高。

从今天起,Imagen 3 将通过 Google Labs 的影像生成工具 ImageFX 在全球 100 多个国家上线。用户可访问 ImageFX 亲身体验。

可以说,Imagen 3 以其卓越的细节呈现、风格多样性和强大的提示词理解能力,为创作者提供了前所未有的高质量影像生成工具,重新定义了 AI 在艺术、设计与创意领網域的应用潜力。

Whisk:影像驱动的 AI 创意工具

除了以上两个主要模型更新,Google Labs 还推出了一个趣味十足的实验项目 Whisk。

这款工具巧妙结合了 Gemini 和 Imagen 3 技术,为创作者提供通过影像提示生成创意内容的新奇体验。

不同于传统需要输入冗长文字提示的方式,用户只需拖拽上传图片,即可分别指定主题、场景和风格,系统会自动完成元素的创意重组。还能依据兴趣选择样式,包括个性化的数字艺术品、徽章、贴纸、玩具等。

在技术实现上,Gemini 模型会先对输入的影像进行智能分析,生成详细的描述信息,并将这些描述输入 Google 最新的影像生成模型 Imagen 3,从而创作出全新的作品。

值得注意的是,Whisk 并非简单复制原图,而是着重捕捉影像的核心特征进行创意重塑。虽然生成结果可能与原图有所不同(如人物的身高、发型或细节特征),但用户可以随时查看并编辑生成的提示词,灵活调整创意方向。

更清楚的操作过程,请看 VCR:

由于看起来实在好玩,我们也迫不及待试了试,让水獭做主角,宫崎骏风格的海边桌面做背景,并且输入 " 角色抱着皮球玩具 " 的补充提示,选择徽章样式。

生成结果如下:

Google 将 Whisk 定位为一款面向快速视觉探索的创意工具,而非传统的影像编辑器。在早期测试中,艺术家与创意工作者们普遍认为这种全新的创作方式充满趣味性与创新力。

目前,Whisk 已在美国市场开放测试,手痒的朋友可以马上去 labs.google/whisk 体验了。这也标志着 Google 在生成式 AI 创意工具探索上迈出的重要一步。

总结

在 OpenAI 今天的搜索功能直播中,虽然地图功能的加入收获了不少好评,但整体内容还是缺乏令人眼前一亮的新意。

相比之下,Google 凭借Veo 2、Imagen 3 以及创意工具 Whisk 的强势推出,占尽主角光环。也再次彰显了其在生成式 AI 领網域的强大技术实力。

从高质量的视频和影像生成到影像提示驱动的创意混合,Google 通过技术创新为创作者提供了更高效、更灵活的工具,让人不得不服。

连续发布的 OpenAI 有些后劲不足,不过,官方预告明天OpenAI 将迎来一场 mini Dev Day,期待会带来真正的惊喜。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們