今天小编分享的科技经验:AI视觉领網域明星「Luma AI」完成千万美元融资,亚马逊、AMD投了,欢迎阅读。
文|周鑫雨
编辑|苏建勋
《智能涌现》获悉,美国硅谷 AI 视觉领網域企业 "Luma AI" 近日完成新一轮融资,金额为千万美元。
该轮的投资阵容包括亚马逊、AMD、Factorial Funds、LDV Capital 四家欧美企业或基金。与此同时,老股东 A16Z、Amplify Partners 和经纬(Matrix Partners)继续加码。
据了解,该轮融资主要用于加速视觉人工智能基础模型和产品的开发。
成立于 2021 年,Luma AI 是一家聚焦于计算机视觉内容的技术型公司,旗下自研模型涵盖视频生成、3D 生成和图片生成。2024 年 1 月,《智能涌现》曾报道了 Luma AI 完成 4300 万美元 B 轮融资的消息,投资方为 A16Z。
在全球范围内,AI 赛道的资源分配都已经进入了 " 中场 "。据科技媒体 Techcrunch 的统计,2024 年下半年月均过亿融资笔数,比上半年少了 10%。与此同时,热钱正在集中涌向 AI 应用层,尤其是 AI 搜索、AI 销售、机器人、AI 编程等领網域。
模型层是基础设施,AI 模型层不能单独成为产品,最终流量需要 AI 应用承接——无论是投资者,还是 AI 从业者,目前已经形成了这一共识。
2024 年 11 月 26 日,主要在模型层发力的 Luma AI,也发布了继视频生成模型 Dream Machine 出圈后的第一款 AI 应用型产品 Dream Machine AI 创意平台。
" 和 ChatGPT 等语言模型相比,视频模型还是比较小众的领網域。"Luma AI 产品设计师 Jiacheng Yang 发现,Dream Machine 的用户主要是有 AI 或者影视制作经验的专业人群。他对《智能涌现》解释了发布主打影像设计的 AI 创意平台的理由:
" 相较于视频生成,影像领網域的用户基础更大,有利于扩大我们的用户基数。我们的目标就是做一款 AI 小白和设计小白都能轻易上手的 AI 视觉工具。"
Dream Machine AI 创意平台,可以理解为一个集合了文生影像设计、AI 头腦风暴、主体 / 风格参考、设计图转视频等功能的设计平台。
Dream Machine AI 创意平台的主体 / 风格参考功能。图源:Luma AI
相较于 Midjourney、Stable Diffusion 等文生图产品,Dream Machine AI 创意平台对自然语言 Prompt 的理解能力更强,同时还能在图片中生成更高清和富有设计感的配文。
Dream Machine AI 创意平台生成的高清配文。图源:Luma AI
Dream Machine AI 创意平台易上手、性能强的原因,仍在于底层的模型能力。目前,平台的语言理解能力,来自 Luma AI 基于第三方语言模型构建的 Agent;图片生成能力,源于 Luma AI 自研的图片生成模型 Luma Photon;而图生视频能力,则来自 2024 年 6 月 16 日发布的自研视频生成模型 Dream Machine。
彼时,Sora、生数科技 Vidu 等视频生成模型只停留于发布 demo 阶段,并没有对外公测。Dream Machine 靠率先 " 免费 "" 公测 ",以及不错的性能、" 梗图 " 的玩法,一度在社交平台走红。
上线 4 天,Dream Machine 的用户数就突破了 100 万。与此同时,Luma AI 数据产品负责人 Barkley Dai 告诉《智能涌现》,Dream Machine 的推广费用为 0。
目前,Luma AI 团队规模在 50 人左右。据 Barkley 介绍,2023 年 12 月决定启动视频生成项目后,团队规模从 10 人扩展到了 50 人,主要引入了视频生成领網域的顶尖人才。
高人才密度作战的效果,体现在了 Dream Machine 的性能上。Dream Machine 目前能够用 20 秒左右的时间,生成 5 秒视频。与此同时,极为仿真的攝影機运动轨迹、自然的光影变化,以及丰富的机位,是 Dream Machine 的特点。在 2024 年 9 月发布的 1.6 版本中,用户只需要输入文字 Prompt,就能调整相机的移动方向。
与此同时,靠 3D 生成技术起家的 Luma AI 旗下,还有 Text to 3D 工具 Genie。彼时,Genie 是市面上仅有的能在 10 秒内生成 3D 模型的工具。
在商业化层面,一方面,Luma AI 旗下的视频、影像、3D 领網域的模型产品,对外提供 API;另一方面,Dream Machine AI 创意平台等应用层产品,将采用限免 + 付费订阅的收费模式。
当下,Luma AI 也成了少有的在视频、影像、3D 多模态领網域全面布局的 AI 初创企业。在公开访谈中,Luma AI 首席科学家 Jiaming Song 提到,多模态模型训练所需的 Token 量远大于语言,多模态的 Scaling Law 能让模型更好地理解世界。
延伸阅读:
《叫板 Sora 出圈后,Luma AI 如何接住泼天的流量?|智涌专访》
欢迎关注!