今天小编分享的科技经验:追赶Sora难在哪 周鸿祎独家回应:算力是问题,欢迎阅读。
Sora 火爆的当下,国内大模型企业如何追赶 Sora,难点在哪儿?2 月 23 日晚,360 集团创始人周鸿祎独家回应了新京报贝壳财经记者的这一问题。他认为,Sora 的技术路线如果被开源,国内将能很快赶上,但在追赶 Sora 时,算力有可能成为门槛,对此,集中国内所有 AI 企业的算力或许是方法之一。
周鸿祎接受记者采访。 新京报贝壳财经记者罗亦丹 / 摄
文生视频技术路线方向已被 Sora 确定 但工程化思路需要探索
Sora 发布后,周鸿祎曾一连发了十多条视频谈论这一文生视频大模型,他认为 Sora 对物理世界的很多描述符合常识,符合人类对世界的认识,因此不能把 Sora 仅看作一个文生视频的工具,而要看到背后人工智能的发展。
对于 Sora 采用的技术,周鸿祎称目前 Pika、Runway 等文生视频公司可能只是使用了文生图模型的相关技术,但 Sora 将文生图模型技术与文生文模型技术结合了起来,因此才能达到令人惊叹的效果。
周鸿祎对贝壳财经记者表示,Sora 所代表的技术路线出炉后,国外也有两条路线的斗争,一条是 OpenAI 的闭源,另一条是以 Meta 为代表的开源," 开源路线的目标就要打破闭源,他们会不断去猜测闭源是怎么做的,最后再开源出来。开源出来的好处是,很多小公司和大公司的个人成员会积极地在开源项目中借鉴他人成果,同时再贡献自己的成果,其化学作用会非常明显。"
在他看来,一旦 Sora 的技术被开源出来,国内就能很快跟上。一个可供参考的事实是,一年前的今天 ChatGPT 冲击科技圈,而国内企业仅用了不到一年的时间就达到了 GPT3.5 的技术水平。
周鸿祎告诉贝壳财经记者,他近几日跟很多 AI 专家有过交流,发现目前许多技术里用到的模型和算法都是公开的,他认为 OpenAI 最大的能力一个是找方向,另一个就是工程化思路非常严谨。因此,现在需要把工程化的思路探索出来," 此前大家学习 ChatGPT 的过程中,同样也是在方向已确定的情况下,解决‘具体一个坎怎么过’、‘碰到一个山怎么翻’,踩很多坑,验证许多具体的方法,这需要时间。"
Sora 可能会生成更长视频 追赶 Sora 国内应集中算力
周鸿祎同时认为,在追赶 Sora 方面,算力可能也是一个坎。
此前,有专家分析称,Sora 的参数规模不大,约为 30 亿。对此周鸿祎持反对态度," 这就弄错了一个概念,视频的参数和文本的参数是不能简单做对比的,文本有 10 万字,视频只有 640×480,但是它两个所占的存储量完全不在一个数量级上。所以 Sora 可能不仅有 30 亿参数,第二就算只有 30 亿参数,他视频分析对算力的消耗应该是远远超过千亿模型的。所以,当现在国内显卡都被卡脖子之后,算力就可能会是一个问题。"
"Sora 为什么只能做 1 分钟视频,我猜测因为它和 4 秒 6 秒有本质的差别,4 秒和 6 秒是因为全部用像素来生成,没有这个世界的知识。4、6 秒之后这个图怎么样?你就想不出来了。" 周鸿祎猜测,Sora 能生成一分钟的视频,就意味着也能生成 10 分钟、60 分钟的视频,但是为什么不做呢?是由于算力和成本的限制。
同样,算力问题也出现在中国的 AI 行业中。对此,周鸿祎表示,他正在思考是否要提出如下建议," 目前,Meta 已经有 50 万块 GPU,明年可能会买百万块,微软应该也会按照百万级别去下订单。而国内的所有人工智能公司加在一起可能有 50 万块 GPU,但都分散在各个公司里。"
在他看来,是否能够把国内的 GPU 算力都集中起来," 我之所以最近一直在科普,是因为 Sora 不仅仅是一个文生视频的工具,如果是的话我们落后就落后了,无非是广告落后一点、电影拍得慢一点,这些落后除了可能对娱乐业造成影响外,不会影响大国竞争,但实际上 Sora 预示着 AGI(通用人工智能)的一个关键节点,所以我认为这对国家很重要。"
新京报贝壳财经记者 罗亦丹
编辑 徐超
校对 张彦君