AI恐怖體操視頻腿腳亂飛、大變活人，LeCun：視頻生成模型根本不懂物理 - 大酷樂

今天小編分享的科學經驗：AI恐怖體操視頻腿腳亂飛、大變活人，LeCun：視頻生成模型根本不懂物理，歡迎閱讀。

一段 AI 生成的體操視頻，引發近百萬網友圍觀，LeCun 等一眾大佬還因為它吵起來了。

體操表演，emmmm 怎麼不算呢？

通過視頻右上角的水印，此段視頻正是由那個一度被認為是 " 下一代 " 文生視頻的Dream Machine（來自 Luma AI）生成的。

大夥兒看後紛紛坐不住，圍繞此讨論的，是 AI 視頻領網域的一個熟悉的話題：AI 是否理解物理規律。

LeCun 直接開麥：

視頻生成模型不理解基本物理知識。更不用說人體了。

華盛頓大學計算機科學教授 Pedro Domingos 看後也 " 搖了搖頭 "：

AGI 可能并不會像一些人預期的那樣即将到來。

畸變雀食離譜

自 Sora 問世以來，"AI 是否理解物理規律 " 這個話題就被越來越多人關注。

下面這段 Sora 生成的 " 寄居蟹用燈泡當外殼的夜間場面 " 是個經典的例子，海浪與沙灘的互動非常細膩，寄居蟹腿上的纖毛也活靈活現。

對比真實拍攝的類似場景照片，也就燈泡沒有電源不應該亮這一個明顯破綻了。

最近 Luma AI 的 Dream Machine 也一樣，生成的第一視角探廢棄房子真實感拉滿：

由此，不少人認為 Sora、LUMA 等的視頻生成模型已經理解了簡單的物理規律。

然鵝，這次被放出的視頻着實有點太離譜。

不僅腿腳亂飛，頻頻上演大變活人：

就這高難度的空中懸浮翻跟頭，也是牛頓都要被氣活了的節奏：

以至于網友看後還表示，說恐怖大可不必，說搞笑還差不多。

‍‍如此抽象，LeCun 直接評論視頻生成模型不會懂物理。

他還進一步解釋，Sora 或者其它視頻生成模型都有類似的問題，視頻生成技術無疑也肯定會随時間推移而進步。

但：

真正理解物理的學習系統并不會具有生成性。就像鳥類、哺乳動物等比任何視頻生成系統更了解物理。然而，它們都不能生成詳細的視頻。

類似還有另一種思考：

即使 AI 視頻生成模型之後會進化的很好，生成的視頻質量 " 完美 "，那麼就意味着它理解物理了？

LeCun 等的觀點，立馬引起網友的質疑：

鳥和哺乳動物也會生成詳細的視頻，只不過是在大腦中生成無法将其具像化。

然鵝，這種反駁并未說服 LeCun。

此外，還有不少人持反對意見。

例如，谷歌 DeepMind/Brain 團隊研究員 Lucas Beyer 就指出：

這就像是展示一個由幾年前的 Dall · E mini 生成的影像，然後稱當前的影像生成方式注定失敗一樣。

畢竟，之前生圖模型生成的影像 be like：

至于模型會生成如此離譜的視頻？

有網友認為是缺乏體操表演數據，還有網友認為是身體部位的模糊處理，使得模型無法理解人體結構，繼而不能保證肢體動作的連貫性。

視頻生成在計算上更為復雜，并且具有高度的上下文相關性，對詳細标注的訓練數據有更大的需求，這些需求現在還未得到充分滿足。

前段時間 SD 3 翻車，同樣對人體生成效果不好，網友也讨論過這一問題，過于嚴格的數據審核，可能誤删了一些無害的成人影像，影響了模型對人體結構的理解。

One More Thing

除了 Luma AI 的 Dream Machine 生成體操視頻大翻車，Runway 的Gen-3也……

同款三頭六臂：

同款空中懸浮絕活：

參考鏈接：

[ 1 ] https://x.com/ylecun/status/1807497091964449266

[ 2 ] https://x.com/giffmana/status/1807511985807908926

[ 3 ] https://x.com/EricDai_BioE/status/1807540558216454281

[ 4 ] https://x.com/Grady_Booch/status/1807556807982010451