大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景

2024-05-04 简体 HK SG TW

今天小编分享的科学经验:美图吴欣鸿:国产Sora竞争关键,在创意、工作流和垂直场景,欢迎阅读。

全球 AIGC 应用浪潮下,怎样将大模型产品以一种更贴近消费者的形式融入生产力工具?

这,或许是 AI 在生产力场景延伸过程中,入场玩家们所要思考的一个重要问题。

中国 AIGC 产业峰会上,美图公司创始人、董事长兼 CEO 吴欣鸿从美图视频大模型的探索之路出发,讲述了美图在影像、视频和设计领網域深耕 16 年而获得的经验与感悟以及对未来的预判。

为了完整体现吴欣鸿的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。

中国 AIGC 产业峰会是由量子位主办的行业峰会,20 位产业代表与会讨论。线下参会观众近千人,线上直播观众 300 万,获得了主流媒体的广泛关注与报道。

话题要点

AI 加持,只用半天,就能做出时长 60 秒的惊艳短片

面对越来越激烈的竞争,创意超越现实、工作流的整合、垂直场景能力这三点非常关键

垂直模型的创新,有两年左右的視窗期

美图不做大而全的模型和场景,更关注垂直的影像和视频模型及场景

以下为吴欣鸿演讲全文:

美图视频大模型的探索之路

一眨眼,美图已成立 16 年。最早,我们做影像工具,像美图秀秀。此外很长一段时间,美图也探索了不同业务,踩了很多坑。

从 2021 年开始,我们基于订阅的商业模式,取得了非常好的经营状态,并重新聚焦于影像和设计产品。现在,我们已经从过去的工具自卑转变成越来越有信心。

我们正逐步往生产力场景延伸,从最初的拍摄、修图、修视频、社交分享到现在新增的视觉创作、专业摄影、专业视频编辑、商业设计等等。

美图现在拥有了影像与设计产品全家桶。产品主要分为AI 影像、视频和设计三个大类。

同时,在生态层,美图今年初收购了站酷,为我们提供了优秀的设计师共创、商用版权销售和专业课程设计等服务。

在模型层,去年 6 月发布的美图奇想大模型为我们以上产品提供了强大的模型能力支撑。

前两天,我们使用美图生产力全家桶制作了一部短片。我想邀请大家观看这个一分钟的短片。

谢谢大家观看。

我想重点介绍这个60 秒的短片是怎么制作出来的。

其实只用半天时间,就能做出同样惊艳的效果。

在前期制作中,我们使用了开拍 AI 脚本以及美图 WHEE 进行风格和角色的一次性约束,确保短片中人物形象和画面风格的一致性。同时,我们还使用 WHEE 的文生图进行了关键的分镜设计。

在中期制作阶段,同样是美图 WHEE,我们将这些分镜制作成视频化,相当于图生视频。

同时,我们还使用美图开拍的 AI 数字人进行了输入对话、唇形同步。

在后期制作环节,我们使用了美图的 Wink 进行视频编辑,并制作了自动字幕和添加音效。

所有这些产品都是由美图奇想大模型驱动的,与 AI 紧密相关。这展示了 AI 原生工作流的有益探索,与传统动画工作流相比,效率得到了很大提升,且门槛大幅降低。

朝着 Diffusion Transformer 架构进化

去年 12 月,我们发布了 MiracleVision 4.0 版本,其中重点是AI 视频和 AI 设计能力。刚才的视频就是使用去年 12 月的视频大模型生成的。

不过,这和最近我们正在训练的美图视频大模型 2.0 在能力上还有很大区别,我简要介绍一下进化的方向。

最早,我们采用了 U-Net 结构,在编码部分也只能进行空间網域压缩。Sora 发布后,我们发现在架构上有很多可以参考学习的地方,因此我们更新了视频大模型的架构,采用了 Transformer 结构,另外还实现了时空網域同步压缩。

美图视频大模型目前正在从 1.0 向 2.0 的跨越,实现全方位的技术更新,模型参数量显著增大,同时将拥有更加强大的语义理解能力,大幅提升视频生成时长、稳定性与内容一致性。

上述的视频大模型 2.0 将于今年 6 月美图影像节正式亮相。

垂直模型创新有两年左右視窗期

我们对未来也有一些预判。现在大家都在追赶 Sora,预计今年下半年将会有很多国产 Sora 扎堆上市。美图的 MiracleVision 也是其中一家。

我们认为,面对越来越激烈的竞争,有三个点非常关键。

第一,创意超越现实。

众所周知,Sora 拥有许多充满创意、奇思妙想的画面,这是实拍很难做到的。同时,如果将这些画面采用传统的视频特效方式制作,成本将非常高昂。

我们认为,视频大模型应与实拍相辅相成,生成一些超越现实的创意画面,成为一种全新的特效制作方式。以前的特效,比如前期做绿幕、后期要做动捕等等,时间长、成本高,而现在 AI 特效可以做到低成本、低门槛。

第二,工作流的整合。

如果只是单纯拼生成能力,比如文生视频,其实它的应用场景是相对有限的。我们正将美图现有的生产力工具能力进行整合,无论是 AI 能力还是传统视频技术相结合,形成类似刚才 60 秒短片的动画制作工作流。

第三,垂直场景的能力。

我们也在探索视频大模型未来能否在电商、广告、游戏、动漫、影视等场景进行深度应用和变现。因此,垂直场景的可用性同样是竞争的关键。

基于垂直创新模型的创新,我们认为有两年左右的視窗期。

在这里,我们对自己业务的要求是,不去做大而全的模型和场景,更关注垂直的影像和视频模型,以及电商、广告等垂直场景。同时,我们也将不断探索 AI 原生工作流,我们认为它是一种更能降本增效的实现方式。

刚才提到,文生视频将是视频大模型的标配,同时还有更多的视频生成方式,如图生视频、视频生视频、音频生视频等。

我们可以看到,无论是哪种视频生成方式,都将有广阔的应用场景。例如,图生视频,因为美图是从图片工具发展起来的,我们每天会产生两亿多张图片,如何让图片动起来?例如,美颜相机的 AI 写真就在探索 AI 视频写真,我认为这是一种更贴近消费者的形式。

视频生视频,我们可以理解为一种全新的视频渲染方式,视频风格化方式。音频生视频,我们现在在探索 MV 的生成,同样也是一个有趣的领網域。同时,开拍的 AI 主播也可以用音频生成,我们录一段音就可以生成 AI 主播完整的口播视频。

在这块,我们也对未来进行了预判。

去年,当然是视频大模型的早期阶段,我们去年 12 月发布的模型,基本上只能生成 3-5 秒的视频片段,世界、动作一致性和稳定性都较差。

今年 2 月,Sora 的横空出世,我们看到确实有些对物理世界的理解,包括在创意、特效上有一定涌现的现象,视频的时长也显著提升。

我们也期待在明年,甚至更远的未来,视频大模型能够实现更深度的物理理解,拥有剧情设计、分镜、转场等更专业的能力,能够与视频制作工作流紧密结合。

也希望大家关注 6 月的美图影像节。除了全新的视频大模型,我们还将有一系列生产力工具全家桶陆续亮相。

今天我就分享到这,谢谢大家!

—  完  —

点这里关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

>
熱門排行
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們