今天小编分享的互联网经验:3D模型+AIGC,vivo移动影像的下一步棋,欢迎阅读。
vivo X90s 影像模组
进入 2023 年下半年,智能手机市场在影像上的军备竞赛有增无减。更大面积的传感器、光学防抖、全焦距的焦段覆盖,正在成为高端智能手机的标配,也有着逐渐普及的趋势。
然而智能手机毕竟是一种大众消费品,重量和体积都会制约影像配置的无限增长。而在消费者端,用户往往对于影像原理不甚了解。因此就需要厂商不断在軟體、算法层面,去解决实际的问题。
7 月底,vivo 首次向外界展示了其位于重庆工厂的 3D 影像实验室,并宣布相关技术将会率先应用在下一代 X 系列旗舰手机上。
vivo 3D 影像实验室内部
vivo 3D 影像实验室,主要是由 100 余台单反相机,配合闪光灯、处理器、控制器和伺服器所组成。通过采集大量的人体躯干、面部信息,最终实现对于智能手机人像拍摄的提高。
采集人体信息时,vivo 3D 影像实验室会同时调动 100 多台单反相机,从不同的角度进行拍摄,生成 100 余张 2D 图片,随后通过局網域网上传至存储伺服器,再通过 2D 图片进行 3D 匹配,生成 3D 模型。
基于生成的 3D 模型,vivo 可以实现对于算法的训练,提升人像模式下,模拟背景虚化的精确性。据 vivo 工作人员介绍,预计每年将会有上万组 3D 人像模型。
传统的智能手机人像虚化算法,往往是在 2D 层面,判断人的轮廓来实现虚化,不具备 3D 层面的深度信息,因此主体与背景之间往往会过渡的比较生硬," 抠 " 出来的背景也会缺少层次。
通过大量的 3D 模型进行预训练,vivo 的算法可以变得更加智能,智能手机可以更好的判断人的纵深信息,使得虚化更具有渐进感也更加细腻。
vivo X90s 試映片
此外 3D 模型加入之后,智能手机的人像虚化算法应用范围可以进一步扩大。目前人像虚化算法由于缺乏深度方向的信息,只能拍摄全身像或是半身像,未来则可以近距离贴脸拍摄眼睛的特写虚化画面。
在 3D 模型之外,vivo 有一套 " 重打光 " 的设备。由 96 个可编程的同步光源搭配 vivo 的工业相机。与拍照工作站以及伺服器共同组成,可以模拟不同光照条件下的成像图片,为自研人像算法做数据支撑,促进 3D 重建和 3D 算法方面的开发和预研,提升手机上的算法效果。
例如在加入重打光技术后,vivo 手机可以对前期拍摄到的 " 逆光黑脸 " 进行高精度补光,甚至是调整光线的冷暖色温。生成式人像编辑则能通过纹理重建与光照估计算法等技术,让用户基于自身喜好对光照、年龄、发型、表情等内容进行重新编辑。
vivo 影像活动现场
基于人像 3D 重建感知能力,vivo 还可以叠加 AIGC 算法,通过 vivo 手机即可拍摄出虚拟与实景结合更为自然的照片,实现 " 足不出户拍出四季人像大片 " 的人性化体验。
在此之外,3D 影像的相关技术可以应用在如今火爆的 3D 虚拟人应用上。包括抖音上比较火的 3D 数字人直播、3D 表情驱动、3D 的虚拟场景编辑以及相应的一个动画制作。
此外还有基于 3D 影像衍生的 3D 换装应用,可以根据采集者的人体模型,在虚拟场景内实现足球游戏,目前在 vivo 手机和平板电腦上已经可以进行演示。
vivo 3D 影像实验室于 2022 年下半年组建,全球共有 7 个实验室。预期 2023 年下半年到 2024 年将会采集几万组数据。这些高质量的数据未来将会与 vivo 全球的用户一起组建兼顾质量和数量的庞大数据库。据 vivo 工作人员介绍,相关技术落地,将会在 vivo X 系列的下一代产品上率先应用。
钛媒体 App 了解到,类似 vivo 这种通过大量采集数据,建立数据库以优化算法的实验室,在传统相机领網域早已有之,但 vivo 应该是通过 3D 模型实现多重优化以及 AIGC 相关应用的第一家智能手机厂商。
某种意义上,自建影像实验室标志着 vivo 在影像领網域的研究进入了深水区,而能够借助 AI 的东风,扩展智能手机影像的边界,则是 vivo 探索出来的一条创新之路,也许会开拓出智能手机影像的全新方向。(本文首发钛媒体 App 作者 / 吴泓磊 编辑 / 钟毅)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App