今天小编分享的科技经验:Sora火了,抖音们慌了?,欢迎阅读。
Sora 有多火?
马斯克、杨立昆、贾扬清、Jim Fan、谢赛宁等各路大佬都在讨论,周鸿祎更是喊出,Sora 的诞生意味着 AGI(通用人工智能)的实现或从十年缩短至一两年。
不少 " 普通人 " 也提前嗅到商机,围绕 Sora 搞钱的生意先火了。有媒体报道,一张网传截图显示,某机构已售出 2 万多份 Sora 培训课程,轻松到手 200 万。
如今,距离 2 月 16 日 OpenAI 发布文生视频大模型 Sora 已经过去快一周,但讨论依旧热烈,这实在是因为它过于优秀。
功能上,它能生成长达 60 秒的视频内容,远超其他文生视频工具几秒至十几秒的限额;它还能进行自我编辑和扩展,将两个不相关的内容过渡在一起,能转换主角周围的风格和环境等;
前景上,Sora 不仅是视频生成工具,它更被视为世界模拟器;
创始团队上,也堪称传奇,核心成员包括 12 人,成立尚未超过 1 年,由两名刚刚毕业的博士生带队,其中还有 00 后。
在兴奋之余,Sora 的强大也让一些内容创作者有了危机意识,有网友评价," 长短视频、游戏行业的朋友们一整年都不会快乐了。"
多位业内人士指出,以目前 Sora 生成视频的长度来看,它的到来最先会冲击到短视频领網域。一旦大范围推广,Sora 将大大降低短视频创作门槛,丰富短视频平台的内容供给,但随之而来的问题是,AI 生成内容的增多可能会影响平台的内容生态,同时 Sora 还会和剪映、快影等工具抢夺用户,让此前的大笔投入付诸东流。
Sora 朝短视频领網域扔下了一枚重磅炸弹,考验创作者和抖音快手们的时刻到了。
1 Sora 降低了门槛,也增加了竞争
虽然市面上已经有不少文成视频工具,比如 Pika、Runway,用户输入文字就能得到一段几秒到十几秒的视频内容,但目前它们并未被广泛使用,主要原因还是效果一般。
某 MCN 机构负责人大成告诉「定焦」,他使用过 Runway," 我们还从外部购买了优质素材,但最终生成的内容不够精良,根本用不了。"
看到 Sora 后,他十分激动," 时长能达到 60 秒,内容还合乎逻辑,感觉和之前的工具不在一个层次上。"
"Sora 与此前的同类产品相比,效果好了不止 10 倍。" 人工智能在读博士、做过相关大模型研究的牛小博表示。" 目前 Sora60 秒的稳定生成效果,将对短视频行业带来革命性影响。"
研究 AI 的阿涅也表达了相同观点," 创作者的门槛被降低,哪怕视频的可信度还没那么高,甚至会出现一些错误,但不仔细很难看出来,将来技术也会很快迭代。"
综合多位从业者的说法,Sora 直接解决了文生视频领網域的两大难题,准确性和一致性。
AI 研究者 Cyrus 的感受是,与之前的工具相比,"Sora 就像三体人打原始人 "。
所谓准确性,指生成的视频能准确识别用户输入的文字需求,一致性是指,在运动过程中,主角在多视角运动变化中内容连贯,不会发生形变,同时其变化还能遵循物理规律。最明显的表现是,主角和背景的互动符合逻辑。
一年前,牛小博和团队还在探讨生成式 AI 无法了解空间尺度,比如生成图尺寸不对,但他们觉得,Sora 的出现已经解决了这个问题。
有人用视频还原物理空间模型,发现也能够对应上,牛小博觉得这证明了 Sora 的空间计算能力基本正确,而人对空间的感知很大一部分也依靠视觉。
从这个角度看,Sora 生成的视频背后,有物理空间的逻辑支撑。
综合多位受访者的观点和多位科技界大佬的公开发言,尽管还有瑕疵,但 Sora 给视频乃至整个人工智能领網域的重大突破在于,这是一个更智能、甚至具备一定思维能力的模型,其生成的视频能理解物理世界的客观规律。
这也让一批做短视频内容的从业者开始思考,Sora 到底会不会抢自己的饭碗?
我们把现有的短视频简单分为两类,一类由真人出镜,往往真人就是一个账号甚至一家公司的 " 核心资产 ",Sora 对这类内容的冲击并不大;另一类由素材集合而成,考验拍摄、创意能力。Sora 的出现,将大大提升这类视频的生产效率。
一些想要提高产量的创作者,非常期待 Sora 的到来。
大成表示,这类工具完全可以取代公司的低端劳动。" 我们公司体量小,为了节省成本招了很多大学生,但他们刚毕业,半天憋不出一个文案,用了 AI,几分钟就能写出上百条。"
去年他和团队就开始大规模使用 AI 工具了," 虽然这些工具还不成熟,但处理文案和粗剪,都很好用。作为一家视频生产商,一定要提高效率。" 他表示。
对于一些有创意的团队来说,则认为短期内 Sora 不会对他们产生威胁。
头部 MCN 机构负责人达克告诉「定焦」,"Sora 还没有开始公测,该技术离成熟还有很长一段时间,而且我们的视频主要靠人的创意、头腦风暴,包括拍摄也是讲究创新的,镜头如何设计、如何过渡,都有思考。虽然 Sora 很强大,但完不成我们目前的创意设计需求。" 他还透露,目前公司没有使用任何 AI 工具。
不过,这些创作者们必须面对的问题是,Sora 的出现降低了短视频创作门槛,会有越来越多的人加入,跟他们抢夺流量和变现机会。
一名新媒体从业者表示,他们有内容创作能力,但苦于没有合适的视频拍摄、剪辑团队,新的工具出现,就是他们的机会。
综合多位业内人士的观点,在类型上,目前 Sora 对真人出镜类短视频影响较小,对动漫类、解说类内容影响比较大,甚至会淘汰很多没有创意、只蹭热点的批量做号公司。在岗位上,部分做机械性重复工作的人员可能会面临淘汰,但创意类人员会被提至更高位置。
总之,未来做短视频,参与者更多,竞争也更激烈。
2 抖音快手们会慌吗?
Sora 的出现,将给短视频平台带来更加丰富的供给,但同时也让抖音快手们面临新的考验。
从业者表示,一方面,AI 生成视频过多,会对短视频平台原有的内容生态造成冲击,另一方面,Sora 的火爆,会抢走一部分抖音、快手旗下剪映、快影等工具的用户。
达克告诉「定焦」,AI 生成的内容在上传短视频平台时,需要特殊标注。
去年 5 月,抖音就发布了《抖音关于人工智能生成内容的平台规范暨行业倡议》,这一倡议提出,要对该类内容进行显著标识,虚拟人使用者需要实名认证,同时对利用 AI 工具创作、发布侵犯肖像权、弄虚作假等内容进行严格处罚。
快手、小红书等平台也有相关的限制。今年 2 月,小红书官方发布 AI 创作内容的规范,要求创作者主动声明 AI 创作内容、不能用 AI 创作内容虚构使用体验进行商业变现等。
多位从业者表示,他们能够明显感觉到,平台在控制该类内容,甚至会限流。
"AI 创作的内容同质化严重,且创意性不高,用户一旦刷到太多相似内容,就会变得不耐烦,甚至转战其他平台。" 一位互联网行业观察者表示。
他还觉得," 如果平台对这类内容不做限制,越来越多创作者也会图省事使用 AI,这会严重影响到平台各类内容占比,最直观的是,一些独有的、稀缺的视频会减少。"
以及还有可能会诞生大量虚假视频。Sora 能快速生产大量逼真的短视频,也让造假变得轻而易举,一些用户对该类内容难辨真伪,一旦被骗,平台公信力也会受到严重影响。去年,利用文生图、AI 换脸等 AI 生成内容进行诈骗的案件就被曝出不少。
在 Cyrus 看来,如果平台扶持 AI 创作类内容,很像 " 为他人做嫁衣 " ,结果就是影响用户留存。" 设想一下,如果小红书上全是字节豆包大模型生产的内容,用户为什么不直接刷抖音呢?反之亦然。"
Cyrus 预测,抖音、快手、小红书、B 站上,不会大量推荐 AI 创作的内容。除非是平台自己做的文生视频大模型,在自家进行大范围推广后,进行单独变现。" 比如当其优化到一定程度,可以直接走用户付费模式,但各家的产品目前都不具备这一能力。"
不止一位业内人士推断,Sora 和其他 AI 视频创作工具之间的差距会越来越大,此前,"Sora 会不会杀死剪映 " 的话题就曾引发热议。Sora 如果被大规模应用,大多数 AI 工具可能会被市场抛弃,其他公司前期的大笔投入将付诸东流。
为什么差距会拉大?
周鸿祎曾公开指出,国内的大模型发展水平表面上看接近 GPT-3.5,实际上离 4.0 还有一年半的差距。牛小博从技术端给出解释,Sora 不是一个点状技术,而是一个复杂的系统工程。即便外界知道其核心技术是 transformer 注意力算法 +diffusion 的扩散算法等,但其背后是 OpenAI 给予的资金支持和积累的超强数据。
OpenAI 通过积累的 GPT 通用语言模型加上 DALL-E3 影像生成模型,发展出视频能够理解图片内容,到 Sora 的时候,又提升了一致性和物理空间理解能力,这每一步的积累,缺一不可。
更大的预测更是让抖音们前路难料。有影视从业者认为,Sora 被大范围使用后,有可能会出现比抖音更大的新平台。
在一部分人看来,Sora 降低了用户门槛,必然导致内容创作者数量级猛增,而抖音这样的短视频平台,其体量、内容创作和推送的逻辑规则,能否承载该类内容很难说,很可能会诞生一个与 Sora 更相符合的平台。
牛小博通过观察互联网行业的发展,也赞同这一观点。" 互联网在早期是专业用户使用,后来 PC 的普及扩大了用户,接着智能手机出现,人人可以联网,以至于服务各类人群需求的平台都出来了。也许随着 Sora 使用人群的增加,会有新的生态出现。"
3 Sora 影响巨大,但不必神化
目前,Sora 还没有开放公测,只有一些视觉艺术家、电影制作人、OpenAI 员工等人士获得了访问权限。一部分原因是,Sora 并非完美无缺。它对短视频的冲击,还没有完全展现。
AI 训练师小刚指出,Sora 存在大模型普遍存在的 " 幻觉问题 ",它在理解物理规律、人与物体互動等方面还存在缺陷。
比如 OpenAI 官网公布了一些缺陷视频,包括蜡烛吹不灭、投篮时篮球在下落过程中爆炸,以及挖出来的椅子直接漂起来等不符合物理规律的内容,这是因为 Sora 的理解还不够成熟,误以为从沙子里挖出来的东西,一般都比较轻。
而具体到短视频行业,小刚认为 Sora 最重要的一个不足是,还做不到人物固定。
举个例子,比如创作者用 Sora 生成了一条 60 秒的视频,画面中主角为 A,但其在生成下一个视频后,主角很可能就换成了 B。
相比 Pika、Runway,大家能看到 Sora 的空间能力很强,但内容再短,做不到人物固定就没有意义,用户持续在短视频平台观看内容,无论是真人还是动画,都需要一个中心人物保证故事的延续性。
以及算力问题,也让很多人担忧 Sora 的普及速度。毕竟技术突破再大,如果成本过高,还是难以被大众接受。多名业内人士认为,这是目前 Sora 面临的最大困难。
" 目前 OpenAI 没有公布 Sora 具体的算力、能源消耗需求以及参数量。初步判断,它需要的数据量、算力以及大量的能源消耗将是巨大成本,而这与其下个阶段的广泛推广必然存在矛盾。" 牛小博认为。
每一次新技术的出现,都会引发一场新旧交替的大讨论。
虚拟拍摄技术刚诞生时,为影视行业节省了拍摄成本,但传统的拍摄方式至今仍然存在。OpenAI 推出 ChatGPT 一年多以来,文字从业者也没有被替代,反而让更多人意识到优质内容创作者的价值。
同理,Sora 对市场上同类 AI 工具带来了冲击,但它再强,淘汰的更多是没有创意、只想走量的短视频从业者,或是不会使用这类工具的人。
至于 Sora 是否会颠覆整个短视频行业,会不会诞生下一个超级平台,目前大家还在观望,需要看 Sora 能否迅速解决现有问题,以及国内有没有新的挑战者诞生。
* 封图及文中配图来源于 Sora 官网。应受访者要求,文中达克为化名。