后期狂喜！一张照片丝滑替换视频主角，动作幅度再大也OK - 大酷樂

今天小编分享的科学经验：后期狂喜！一张照片丝滑替换视频主角，动作幅度再大也OK，欢迎阅读。

后期狂喜了家人们～

现在，只需一张图片就能替换视频主角，效果还是如此的丝滑！

且看这个叫做 "VideoSwap" 的新视频编辑模型——

小猫一键变小狗，基操～

如果原物体本身扭动幅度大一些？也完全没问题：

细看俩者之间的运动轨迹，给你保持得是一毛一样：

再如果，替换前后的物体形状差别较大呢？

例如车身较高的 SUV 换更长的超跑，大邮轮换小白船。

呐，也是一整个完美替换，基本看不出任何破绽：

对比谷歌今年 2 月发的同类视频替换模型 Dreamix：

不得不说，现在这技术进步真是肉眼可见啊～

那么，它是如何做到的呢？

方法也很有意思。

只需几个语义点，拽一拽就 OK

不管是风格转换还是主题 / 背景转换，这种视频编辑任务的主要挑战都是如何从源视频中提取运动轨迹传输到新视频、覆盖到新元素上，同时确保时间一致性。

此前的模型（原理包括编码源运动、使用注意力图、光流等）大多数顾此失彼，要么在时间一致性上做的不好，要么会严格限制形状变化。

在此，VideoSwap 提出使用少量语义点来描述物体的运动轨迹。

如下图所示，飞机的运动轨迹就可以通过机翼、机头和机尾的 4 个点来表示。

而在替换成直升机时，我们可以删除两个点，在只保留机头和机尾来对齐运动轨迹的同时，免除形状约束，让体型不一样的直升机得以替换。

除了删除语义点，它还能拖拽。

像开头展示的这个 SUV 变超跑，由于车身变长了，我们不对语义点进行处理，超跑就变形了：

对此，我们只要将 SUV 车头和车尾的几个点稍加挪动就 OK：

下面这个天鹅的替换视频也是经过了语义点拖拽：

那么具体来说，VideoSwap 是如何操作的呢？

从它的 pipeline 来看，简单来说，VideoSwap 也是基于扩散模型（潜扩散）。

它首先用 VAE 编码器对源视频进行编码，获得潜空间表示；然后用 DDIM 反演将它变换回有噪声的表示。

接着用文本提示中的源主题（例如猫）替换目标主题（狗），并使用 DDIM scheduler 进行去噪。

在这个去噪过程中，就可以引入语义点对应关系来引导目标主题遵循原来的运动轨迹进行生成了。

最后，为了保留背景，作者在此还采用了一个潜混合的概念。

此外，他们还通过将视频运动层集成影像扩散模型中，来确保结果的时间一致性。

这里的关键点之一就是 VideoSwap 中的语义点提取和注册（register）pipeline。（" 注册 " 是指把语义点安插到源视频）

首先它需要我们在关键帧得標出关键语义点，然后再从视频中提取所标语义点对应轨迹的 embedding。

接下来在语义点匹配中，embedding 由多个 2 层可学习 MLP 投射，并根据其坐标位置放置到空特征中，然后逐元素添加到扩散模型中作为运动引导。

至于用户拖动语义点后还可以让视频保持很好的一致性，这里用到的技术则是基于分层神经图谱（LNA）的点位移传播。

通过被训练过的 LNA，用户拖动产生的位移就能通过它的规范空间一致地传播到每一帧之中。

最后，作者表示：基于以上这些方法，VideoSwap 通过大量测试，最终取得了 SOTA 成绩，成为目前最好的视频变换模型。

这是它和一些主流方法的效果对比：

目标是把飞机变直升机。

可以看到，除了 VideoSwap，绝大多数方法都只在机头部分往直升机的方向靠拢，不细看都发现不了，并且有的还伴随着明显的闪烁和伪影。

作者介绍

VideoSwap 由新加坡国立大学和 Meta 合作完成。

一作 Yuchao Gu 为新加坡国立大学博士生，此前硕士毕业于南开大学，他的研究方向正是 AIGC，尤其为视频生成为主。

他同时也是 Meta GenAI 方向的实习生。

通讯作者为新加坡国立大学助理教授 Mike Z. Shou，他此前是 Facebook AI 的研究员。

参考链接：

https://arxiv.org/abs/2312.02087

https://videoswap.github.io/

— 完 —

点这里关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

>

熱門排行

“中国教师”服务平台正式上线，我国甄正浩 | 2025-04-03
中金：对等关税或将加大不确定性和市嬴覓晴 | 2025-04-03
百亿级私募入场“扫货”，加码创新药嬴覓晴 | 2025-04-03
飞傲 USB 数字音频线 LINK 上市：双習又夏 | 2025-04-03
关于 AEB 什么时候不能用，我们翻遍佼昌翰 | 2025-04-03
四线对决？皇萨西甲争夺激烈，西超杯、習又夏 | 2025-04-03
贵州茅台，重磅发布！2024年营收突破17 衛青柏 | 2025-04-03
“爆买”日本之后，中国人正在“爆入惠惠君 | 2025-04-03
坐二望一！奇瑞一季度真“猛” 賁芳蕤 | 2025-04-03
日本H，在短短十年从遥遥领先变成遥郟君昊 | 2025-04-03
高露现身上海虹桥机场黑色外套点缀亮色爱心装饰俏皮亮眼惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最强芯袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表情庆祝賁芳蕤 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
曹操墓，里面都有啥？衛青柏 | 2023-05-02
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露面賁芳蕤 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花板”？謝飛揚 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖尿病人集玲琳 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望袁曼雁 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游戏+AI”能否逆风翻盘？衛青柏 | 2023-05-04
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15日寸飛蘭 | 2023-05-05
普京签署总统令，批准对俄刑法典相关法条的修正案集玲琳 | 2023-05-02
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
解除资格！停止一切合作佼昌翰 | 2023-05-02
前董事长被免，天山生物全面进入“中植系”时代？股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
3699起联想小新mini主机上架 13代酷睿标压处理器習又夏 | 2023-05-05
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线涨幅汇总袁曼雁 | 2023-05-07
事关农村土地承包和农民权益，《农村土地承包合同管理办法》5月1日起施行郟君昊 | 2023-05-02
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
200户连夜疏散，原因让人愤怒！“损失超一亿”，官方通报袁曼雁 | 2023-05-03
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的生活》证实将停办佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《与凤行》…在路上了惠惠君 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊带裙大秀好身材嬴覓晴 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，不容小觑幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02