今天小编分享的科技经验:AI视频工具又上新了!120秒生成高清视频,丝滑渲染3D艺术字,在线可玩,欢迎阅读。
编译 | Vendii
编辑 | 漠影
智东西 8 月 22 日消息,据 VentureBeat 8 月 20 日报道,专注于 3D 内容生成技术的 AI 初创公司 Luma AI 发布了 Dream Machine 1.5。该版本提高了 AI 视频生成效果,在逼真度、运动追踪及 prompt 理解等方面有所提升。此次更新距 Dream Machine 首次面世已过去 2 个月。
Dream Machine 能够在 120 秒内生成包含 120 帧的高质量视频。用户只需简单输入相关提示,点击生成按钮,系统便会在 1 至 2 分钟内完成视频渲染。工具目前对所有公众开放,每个用户每月有 30 次的免费生成额度,但生成结果不可商用。
Luma AI 当日在社交平台 X 上宣布:"Dream Machine 1.5 来了!它的文生视频、图生视频效果都得到了提升,prompt 理解更为精准,自定义文本渲染能力也得到了改良!"
值得注意的是,新版本尤其增强了渲染文本的能力,这是 AI 视频生成技术一直面临的难题。这个进步为动态标题序列、动画标识设计和演示幻灯片制作等任务开辟了新的可能性。
体验地址:https://lumalabs.ai/dream-machine/creations
一、会 3D 文字渲染、能理解阿拉伯语,视频生成只需 2 分钟
一直关注 AI 领網域的平面设计师 @aziz4ai 在社交平台 X 上分享了 Dream Machine 1.5 的应用实例,展示了该模型在创造复杂视觉效果方面的能力。在其中一个实例中,该模型生成了 " 彩虹色液体 3D 文本 ",以 "LUMA" 字样呈现,展现出流畅且精致的视觉效果。
▲ @aziz4ai 用 Dream Machine 1.5 生成的彩虹色液体 3D 文本 "LUMA"
此外,Dream Machine 1.5 在处理非英文 prompt 方面取得了进步。在 @aziz4ai 分享的另一个应用实例中,prompt 使用了阿拉伯语输入,其中包含一个要求:一个男人在木板上切肉,然后将这些肉块以电影化手法变成 " 每日现切 "(" يحضر يوميا ")字样。
▲ @aziz4ai 用 Dream Machine 1.5 生成的阿拉伯语字样
生成的视频很好地将阿拉伯语文字融进了画面,既展现了 Dream Machine 1.5 的文本渲染能力,也体现了它的多语言处理能力(Multilingual Processing)。
此次模型优化还提升了视频生成速度,约 2 分钟即可生成一段长达 5 秒钟的高清视频。这一效率提升,尤其适用于需要快速生成大量视频作品的内容创作者和市场营销人员。
二、业界率先公测,已积累大量用户反馈
尽管 AI 视频生成领網域的竞争日益激烈,但 Luma AI 将产品开放公测的策略使其脱颖而出。
相较而言,OpenAI 的 Sora 虽然拥有强大性能,但自今年 2 月 16 日公布以来仍处于内测阶段,仅供部分合作伙伴使用,这种排他性限制了它的实际测试和应用。另一方面,快手的可灵于今年 6 月 6 日推出、7 月 24 日全面开放内测,短时间内便获得了众多关注。
而 Luma AI 的 Dream Machine 早在 6 月 12 日就开放了公测,因而积累了庞大的用户基础,并收集了大量的应用反馈。这使得 Luma AI 能够针对各类实际应用场景进行模型优化。结合广大用户反馈和实际应用数据,Luma AI 得以解决具体的用户痛点,并进一步增强大部分用户最需要的功能。
一些行业分析师认为,开放公测能催生更为稳定可靠且功能丰富的 AI 视频工具。来自各行各业的用户创作的内容,为 Luma AI 提供了丰富的数据集,使得其模型迭代速度有机会超过内测的模型。
诚然,这种公测策略也带来了挑战。随着 AI 视频生成变得越来越普及,如何防止滥用,如深度伪造和误导性内容,成为了行业面临的主要难题。尤其需要强有力的监控机制以及伦理规范加以约束。Luma AI 对此尚未明确表明立场。
结语:愈演愈烈的 AI 视频生成大战
自 Sora 发布以来,国内外的视频生成新模型新工具密集发布。据统计,仅国内,当前便有约 20 家公司推出了自研 AI 视频模型。
前有快手可灵发布后 1 个月就实现 3 次重大更新,后有 Luma AI 2 个月迭代 Dream Machine 新版本 …… 尽管有飞快的更新速度,AI 视频生成仍面临着可生成长度过短、画面形变等问题。在越来越卷的赛道上,谁将成为最后赢家?
来源:VentureBeat