今天小编分享的财经经验:Sora来临,它能抢了谁的饭碗?,欢迎阅读。
继 ChatGPT 后,OpenAI 在 2024 年初又掀起了人们的讨论热情。
2 月 16 日清晨,OpenAI 发布了文生视频 AI 模型 Sora,引爆全球网络。与以往的文生视频模型 Runway 和 Pika 不同,Sora 可以持续地模拟人物、动物和物体,并生成同一角色的多个景别的镜头,在整个视频中保持其外观和背景。
此外,Sora 还可以生成图片。与以往相比,这些图片中的细节更清晰,包括脸上的斑点和嘴唇上的细纹,分辨率最高可达 2048x2048。
一石激起千层浪,Sora 发布后,一众科技圈大佬纷纷下场讨论。马斯克表示 "gg humans"(gg/good games 原指游戏结束时玩家互相致意,后引申为 " 游戏结束 "); 周鸿祎预言:" 这可能给广告业、电影预告片、短视频行业带来巨大颠覆 ";前阿里副总裁贾扬清则评价:" 真的非常牛 "。
" 霸榜 " 近日科技板块热点的 Sora 大模型亮点在哪里?具体来看,这会对影视制作行业起到怎样的影响?
高质量、长时间、多景别
简单来讲,Sora 能够根据文本提示,创建 60 秒的视频、扩展现有视频以及从影像中生成视频,视频中还包含复杂的场景和镜头运动。
OpenAI 官网展现了多段 Sora 制作的视频,身着黑色皮衣、红色裙子的女子在雨后的夜晚行走在东京市区街道上,女子皮肤毛孔色沉清晰可见,路面积水反映着路灯倒影,视频真实度十分之高,如果不是偶尔穿帮的左右腿,很难一眼判断是 AI 制作的视频。
在运镜、构图等方面,Sora 视频都呈现出大幅度的提升,一举将 AI 视频提升至 "next level"。
图源 OpenAI
此外,Sora 不仅能够生成完整的 60 秒视频,还能延长已生成的视频。也就是说,给 Sora 一段视频,它可以自动生成前面或者后面的视频。
更离谱的是,Sora 可以生成不同机位、不同景别的视频,并进行剪辑。且在不同的机位下,无论是广角、中景、近景、特写,室内还是室外,视频中人物和背景的关系都一致,不受影响。
图源 OpenAI
也就是说,仅需要一段文字,Sora 模型就可以生成一段 60s 的 1080p 视频,包含不同景别镜头。不由得让人感叹—— " 真实和虚幻的差别,到底还有多大距离?"
值得注意的是,文生视频早已存在,根据知名投资机构 a16z 统计,截至 2023 年底,市场上共有 21 个公开的 AI 视频模型,例如 Google 的 Lumiere、Stability AI 的 SVD、以及视频生成大模型 Gen-2 的开发商 Runway。其中,Runway2023 年 6 月底完成 C 轮融资后,估值则是超过 15 亿美元。
Sora 公开后,东吴证券对目前主要的视频生成模型做了对比。他将 Sora、W.A.L.T、Gen-2 和 Emu Video、Pika 1.0、Stable Video 六个模型的特点、生成视频表现等特点进行对比分析。结论是,Sora 在生成时长、一致性等方面都有显著的优势,具有突破性的语义理解能力。
图源东吴证券
去年年初,ChatGPT 横空出世,而一年后,Sora 就实现了视频的快速创作,如此快的发展速度令人心惊。毕竟一年前,AI 生成视频还是这样。
图源网络
有 B 站网友表示:" 小时候还想过,未来会不会有这样一种拍电影的技术,戴上腦机后靠人腦的想象来生成各种各样壮丽恢宏的电影画面,谁知这个现实已经不远了。"
虽然目前 Sora 还处于测试阶段,只面向邀请的制作者和安全专家开放测试 ( 据称是一些视觉艺术家、设计师和电影制作人 ) 。然而资本端已然闻风而动,CB Insights 的数据则显示,OpenAI 目前是世界上最有价值的科技初创企业之一,仅次于字节跳动和 SpaceX。
在根据 Thrive 牵头的收购要约进行现有股票出售后,当前 OpenAI 的估值已经达到 800 亿美元以上 , 达到九个月前的近 3 倍。
只不过,有人欢喜有人愁,对于一些影视行业从业者和 AGI 视频初创公司,Sora 的问世很难说是喜事。
风暴来袭
Sora 发布,最直观的影响就是 AGI 视频创业公司。
曾在 2023 年热映影片《瞬息全宇宙》中参与制作的 Runway,其 CEO 瓦伦祖拉在 Sora 发布后,在 X 平台上发布了两个字,"Game On." ( 竞争开始了 ) 。
图源 X 平台
对于字节跳动来说,Sora 的出现无疑是对于剪映的一大威胁。今年,就在 Sora 问世的一周前,原抖音集团 CEO 张楠卸任,转而投入剪映,反映出抖音对于 AIGC 工具的重视。随着 Sora 的不断发展,剪映如何才能学习 Sora 并创新,成为了当务之急。
除此之外,Sora 类 AI 模型对于好莱坞以及电影、电视、广告等领網域的影响是最直观的。
美国行业调查公司 CVL Economics,上个月发布的一项对 300 位好莱坞行业领袖的调查显示,75% 的受访者承认,生成式 AI ( 工具、軟體、模型 ) 已经促使他们业务部门削减与合并工作岗位,担忧情绪弥漫在整个好莱坞。
那些掌控着好莱坞行业秩序的大佬预计,未来三年好莱坞总计会有超过 20 万人的工作岗位会遭受 AI 冲击,尤其是视觉特效、音效师、画图师等后期工作岗位。
图源 OpenAI
不过,回顾内容创作的历史,工具的发展无法阻挡,进步是常态,比起抵制,创作者更要思考哪些环节和内容变得更有价值。
从 AI 制作视频的流程上来看,当前的 Sora 需要先输入一段文字,随后再生成视频,视频的原创性还是在依赖着创作者的审美,Sora 的工具属性更加突出。比起原创内容,Sora 的优势更在于,那些需要耗费大量人力物力的特效片段。
所以,也有网友预测,虽然未来视频制作流程中的剪辑师、特效师等后期岗位会面临更为严峻的处境。但过往那些受限于拍摄成本、拍摄技术的内容,则会更受关注。
理想的情况下,Sora 未来能够代替更多机械、重复的工作,使得创作者可以集中精力于创新的、深度的解读,给文化消费者们提供更优质的内容。
此外,由于 AI 的理解内容更加偏向于输入 " 关键词 ",而非剧本。所以在未来,如何创作出适合 AI 理解的剧本,从而生成视频,也是值得关注的问题。
Sora 的价值,不止视频
目前来看,Sora 最直观的影响是视频制作行业,但他的野心,或者是众多大模型的野心远不止于此。
OpenAI 官网上,将 Sora 定位为世界模拟器。OpenAI 认为,其能够有效地模拟物理和数字世界,包括其中的物体、动物和人类等各种因素。根据 OpenAI 的报告显示,Sora 在理解地球物理世界的规律层面,取得了巨大的进展。
当然,目前的 Sora 作为一个模拟器当前还存在着一定的缺陷,世界模型仍然不够完善。在 OpenAI 发布的 48 个 Sora 生成的视频中,就出现了不少穿帮的画面。
例如玻璃杯还没有破碎,但是液体已经流出;人们在沙漠中挖出变形塑料椅子;一个男人在倒着跑跑步机等不符合逻辑的视频内容。简单来说,一些对于人类来说约定俗成的因果规律,Sora 模型短期内无法推理。
图源 OpenAI
就已有信息来看,目前的 Sora 仍处于 1.0 阶段,在处理精细的背景时常常出现力不从心的情况,但没人会否认 Sora 对于 AGI 实现路程上的里程碑地位。
AI 风口下,Sora 的出现让我们看到了 AGI 实现的可能,也逼迫着同行业内不断创新发展。毕竟泡沫过后,赢家只能有一个。