今天小編分享的科技經驗:追趕Sora難在哪 周鴻祎獨家回應:算力是問題,歡迎閲讀。
Sora 火爆的當下,國内大模型企業如何追趕 Sora,難點在哪兒?2 月 23 日晚,360 集團創始人周鴻祎獨家回應了新京報貝殼财經記者的這一問題。他認為,Sora 的技術路線如果被開源,國内将能很快趕上,但在追趕 Sora 時,算力有可能成為門檻,對此,集中國内所有 AI 企業的算力或許是方法之一。
周鴻祎接受記者采訪。 新京報貝殼财經記者羅亦丹 / 攝
文生視頻技術路線方向已被 Sora 确定 但工程化思路需要探索
Sora 發布後,周鴻祎曾一連發了十多條視頻談論這一文生視頻大模型,他認為 Sora 對物理世界的很多描述符合常識,符合人類對世界的認識,因此不能把 Sora 僅看作一個文生視頻的工具,而要看到背後人工智能的發展。
對于 Sora 采用的技術,周鴻祎稱目前 Pika、Runway 等文生視頻公司可能只是使用了文生圖模型的相關技術,但 Sora 将文生圖模型技術與文生文模型技術結合了起來,因此才能達到令人驚嘆的效果。
周鴻祎對貝殼财經記者表示,Sora 所代表的技術路線出爐後,國外也有兩條路線的鬥争,一條是 OpenAI 的閉源,另一條是以 Meta 為代表的開源," 開源路線的目标就要打破閉源,他們會不斷去猜測閉源是怎麼做的,最後再開源出來。開源出來的好處是,很多小公司和大公司的個人成員會積極地在開源項目中借鑑他人成果,同時再貢獻自己的成果,其化學作用會非常明顯。"
在他看來,一旦 Sora 的技術被開源出來,國内就能很快跟上。一個可供參考的事實是,一年前的今天 ChatGPT 衝擊科技圈,而國内企業僅用了不到一年的時間就達到了 GPT3.5 的技術水平。
周鴻祎告訴貝殼财經記者,他近幾日跟很多 AI 專家有過交流,發現目前許多技術裏用到的模型和算法都是公開的,他認為 OpenAI 最大的能力一個是找方向,另一個就是工程化思路非常嚴謹。因此,現在需要把工程化的思路探索出來," 此前大家學習 ChatGPT 的過程中,同樣也是在方向已确定的情況下,解決‘具體一個坎怎麼過’、‘碰到一個山怎麼翻’,踩很多坑,驗證許多具體的方法,這需要時間。"
Sora 可能會生成更長視頻 追趕 Sora 國内應集中算力
周鴻祎同時認為,在追趕 Sora 方面,算力可能也是一個坎。
此前,有專家分析稱,Sora 的參數規模不大,約為 30 億。對此周鴻祎持反對态度," 這就弄錯了一個概念,視頻的參數和文本的參數是不能簡單做對比的,文本有 10 萬字,視頻只有 640×480,但是它兩個所占的存儲量完全不在一個數量級上。所以 Sora 可能不僅有 30 億參數,第二就算只有 30 億參數,他視頻分析對算力的消耗應該是遠遠超過千億模型的。所以,當現在國内顯卡都被卡脖子之後,算力就可能會是一個問題。"
"Sora 為什麼只能做 1 分鍾視頻,我猜測因為它和 4 秒 6 秒有本質的差别,4 秒和 6 秒是因為全部用像素來生成,沒有這個世界的知識。4、6 秒之後這個圖怎麼樣?你就想不出來了。" 周鴻祎猜測,Sora 能生成一分鍾的視頻,就意味着也能生成 10 分鍾、60 分鍾的視頻,但是為什麼不做呢?是由于算力和成本的限制。
同樣,算力問題也出現在中國的 AI 行業中。對此,周鴻祎表示,他正在思考是否要提出如下建議," 目前,Meta 已經有 50 萬塊 GPU,明年可能會買百萬塊,微軟應該也會按照百萬級别去下訂單。而國内的所有人工智能公司加在一起可能有 50 萬塊 GPU,但都分散在各個公司裏。"
在他看來,是否能夠把國内的 GPU 算力都集中起來," 我之所以最近一直在科普,是因為 Sora 不僅僅是一個文生視頻的工具,如果是的話我們落後就落後了,無非是廣告落後一點、電影拍得慢一點,這些落後除了可能對娛樂業造成影響外,不會影響大國競争,但實際上 Sora 預示着 AGI(通用人工智能)的一個關鍵節點,所以我認為這對國家很重要。"
新京報貝殼财經記者 羅亦丹
編輯 徐超
校對 張彥君