大火的AI扩图，为何被网友直呼“离谱”？

今天小编分享的财经经验：大火的AI扩图，为何被网友直呼“离谱”？，欢迎阅读。

中新经纬 12 月 10 日电 ( 林琬斯 ) 近日，AI 扩图火爆出圈，抖音话题 "AI 扩图 " 累积 9.2 亿次播放量，"AI 扩得很好下次别扩了 " 的话题在抖音超 7.7 亿次播放。

不少网友也在社交平台分享了自己扩图后的照片，有人称 " 拯救了我的废片 "，也有人直呼 " 别太离谱 "" 根本不管人的死活 ""AI 比人还癫 "。目前，AI 扩图的市场热度还在发酵，吸引了互联网巨头及一些上市公司布局。

频出意外，原因何在？

AI 扩图，是将一张照片按照等比例或者自由角度扩展，AI 会根据影像内容，预测和补充扩展出来的部分。

目前 AI 扩图的用法，一种是单张图扩图，另一种是用一张图片，不停扩图。

对比扩展前后两张图片可以发现，部分需要扩大背景范围的照片出图效果较为合理，但当原图出现额外元素需要补充完整时，AI 很难根据细节，想象出相应的人、物形象，比例和位置也不太准确。

在网友上传的部分作品里，AI 扩图直接给人修改了物种：对于拍照不露脸的人长啥样，AI 扩图帮你揭晓：" 人模狗样 "；一女子身着卡其色外套拍照，AI 扩图直接将上半身 " 嫁接 " 到同色木质栅栏上。更有照片 AI 扩图后出现不可描述的内容，令网友直呼 " 毁三观 "。

网友上传自己的半身照，AI 直接将其变鸟人。图片来源：社交媒体

这 " 脸牌 " 看着诡异。图片来源：社交媒体

一位爸爸亲吻妈妈的孕肚，AI 扩图将孕肚当脸用。图片来源：社交媒体

AI：我是懂脱单许愿的。图片来源：社交媒体

另一种用法是用一张图片，不停扩图。根据网友在社交平台上分享的经验，到最后会变成列车、飞机，变成城市、森林的一角。

一些影视经典名场面也 " 惨遭毒手 "，如甄嬛传中表情严肃，正在回宫路上的甄嬛，扩图后身穿运动服与运动鞋在深宫中打篮球；第一次 AI 扩图，躺在枕头上的皇上出现孕肚，再次扩图后，AI 给皇上加了腿又加了行李箱，故事更新成 " 孕期离家出走 "。

实际上，走红的 AI 扩图，是 AIGC ( 生成式人工智能 ) 领網域促生的众多热门赛道之一。针对扩图后出现意料之外的情况，硅基智能 CTO 林会杰在接受中新经纬采访时指出，这与 AIGC 算法仍未发展成熟，无法做到精准控制生成的图片内容有关。

林会杰认为，AI 扩图与 AI 文生图技术同源，AI 文生图需要通过语义信息的输入才能生成图片，文字描述本身相对泛化，很难精准控制 AI 呈现的内容，而 AI 理解的内容也很难精准呈现人类的想法，不像人类绘图一样精准。AI 扩图在原有图片的基础上扩充一些图片信息，本质上与 AI 文生图的技术原理类似。

多家厂商布局 AI 扩图

实际上，AI 扩图并不是新鲜事物。中新经纬不完全统计，目前包括 Midjourney、StabilityAI、Adobe、美图秀秀、Wink 等已试水相关应用产品和场景，涉足 AI 扩图领網域。

今年 3 月，Adobe 发布 AI 创意生成工具 Firefly，并于 5 月底宣布全面开放。其中就有一键扩展现有照片和影像的功能。今年 7 月，Midjourney 更新了 " 平移扩图 " 功能，可以将图片自由前后平移。

7 月中旬，港股上市公司美图公司旗下产品美图秀秀上线 AI 扩图功能。目前在美图秀秀 APP 首页仍有 AI 扩图的入口，每人每天有 3 次免费机会，可对影像进行 110%、125%、150%、200%、300% 不同比例的扩图。

另外，AI 扩图在 B 端的应用还包括营销海报设计、电商图片制作、游戏素材设计等。

不过目前，一些个人创作者开发的 AI 扩图小程式和网站并不多见。中新经纬在微信内进行搜索，以 "XXAI 扩图 " 命名的微信公众号、小程式并不多，其中不少也并非免费使用。

下一个热点在哪？

实际上，就在 2022 年年底，AIGC 另一赛道 AI 绘画成为社交平台上的流量密码，也被众多网友吐槽 " 多少有点离谱在身上 "。

今年 7 月，妙鸭相机走红，用户选择 20 张以上照片，支付 9.9 元，再选择喜欢的模板，就能生成自己的 " 数字分身 "，效果堪比市场价几十元甚至几百元的艺术照。

近日，据 " 妙鸭相机 " 公众号，妙鸭又上线了新功能 AI 修图。用户上传满意的照片制作一个数字分身，就可以获得一个量身定制的 AI 修图师，实现一键精修，这让过去 1 个女生要花 1 小时的美颜修图几秒钟就能完成。

发展至今，AIGC 下一个热点在哪？

林会杰指出，AIGC 技术未来将更多地往视频领網域发展。他表示，视频才是使用最普遍、用户接受程度最高、想象力最丰富的应用场景，远大于图片的表现力、互动性与想象力。相比图片，视频更能将内容进行高维度呈现。

实际上，今年爆火的 AIGC 还有图片生成视频。

近日，阿里推出了 Animate Anyone，该项目由阿里巴巴智能计算研究院开发，用户只需提供一个静态的角色影像和一些动作、姿势，便可将其动画化，同时保留角色的细节特征。

11 月中旬，社交媒体巨头 Meta 发布工具 Emu Video，能够基于文本和影像输入生成视频剪辑；字节跳动发了 PixelDance 模型，通过描述 ( 纯文本 ) + 首帧指导 ( 图片 ) + 尾帧指导 ( 图片 ) ，即可生成包含复杂场景和动作的视频。

另外，Runway 在 Gen2 中上线 Motion Brush 动态笔刷功能，只需对着影像任意位置一刷，就能让静止的一切物体动起来；Stability 推出 Stable Video Diffusion，可以从影像中生成高品质的视频剪辑。

另外，数字人方向也是 AIGC 技术发展和应用方向，数字人技术能够结合 AI 生成的形象应用于视频场景。

10 月，明星跨语言翻译视频在全网疯传，视频中郭德纲飙英文、歌手泰勒•斯威夫特用流利的中文接受采访，不仅音色与本人相似，甚至连口型都能对上，这让不少人表示 " 配音演员要失业了 "。在今年 6 月的上海电影节期间，硅基智能成功 " 复活 " 已逝的人，让已故导演谢晋通过数字人的形式和现场观众见面。

( 更多报道线索，请联系本文作者林琬斯：[email protected] ) ( 中新经纬 APP )

( 文中观点仅供参考，不构成投资建议，投资有风险，入市需谨慎。 )

责任编辑：罗琨常涛

作者：王永乐