大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

AI視頻「閃爍」難題攻破!輕松改變視頻風格,北大校友一作

2023-06-15 简体 HK SG TW

今天小編分享的科學經驗:AI視頻「閃爍」難題攻破!輕松改變視頻風格,北大校友一作,歡迎閱讀。

AI 拍視頻,竟然已經絲滑到這個程度了嗎?

輸入一段視頻,念上一段 " 咒語 ",AI 瞬間就能秒懂,并當場給你把視頻重畫一遍:

不僅完美 hold 住各類風格,最關鍵的是,幀幀絲滑流暢。

就連建築物這種細節較多的視頻,也幾乎看不出 "AI 出品 " 的 bug:

目前,無論是拍視頻還是制作動畫,依靠的都是 " 關鍵幀 "。如果幀與幀之間聯系不緊密,就會出現這種詭異的 "閃爍畫風" ——

而這也是 AI 生成視頻最大的瓶頸之一。

現在,來自南洋理工大學的團隊,終于解決了這個問題,研究在推特上掀起了不小熱度:

那麼,這究竟是如何做到的?

如何讓 AI 拍的視頻不 " 閃爍 "?

AI 生成視頻會 " 閃爍 ",本質上是前後幀不連貫導致的。

舉個例子,這是同一個視頻中截取的兩幀畫面:

用 AI 根據這兩幀 " 重繪 " 影像,乍一看問題不大,細節上卻有不少差異。

例如,一幀生成的人物頭上有 " 金色發帶 ",另一幀中卻消失了:

這樣一來,看似 AI 生成的幾十幀影像風格差不多,連起來細節差異卻非常大,視頻也就容易出現閃爍現象:

為此,研究人員提出了一種新框架,,核心是提升 AI 生成視頻時幀與幀之間的連貫性。

這個框架包含關鍵幀翻譯(key frame translation)和完整視頻翻譯(full video translation)兩部分。

第一部分基于擴散模型生成關鍵幀,基于跨幀約束加強這些關鍵幀之間的一致性;第二部分則通過基于時間感知的匹配算法将其他幀與關鍵幀 " 連接 " 起來。

框架的核心,在于第一部分。

研究人員給這部分提出了一種新的分層跨幀一致性約束方法,在原視頻基礎上,利用光流來約束幀與幀之間的關系。

其中,第一幀相當于整個視頻的 " 錨點 ",用于控制視頻的整體走向;後續的每一幀,則都會以前一幀作為參考,防止生成的影像偏離最初的風格、形狀、紋理和顏色等。

至于視頻生成模型,核心采用的則是 Stable Diffusion+ControlNet 的組合,但經過了改進。

如下圖所示,紅色虛線是原本 Stable Diffusion 等擴散模型采樣過程,黑色線條則是經過調整後的過程:

當然,在不同的采樣階段,跨幀約束也不一樣,包括形狀感知、像素感知等。

相比之前的 AI 視頻生成模型,這個框架最大的優勢在于,當輸入一個新視頻的時候,它不需要再用這個視頻材料重新進行訓練,換而言之就是零樣本學習。

只需要輸入一段提示詞 + 一段視頻,框架就能自動将視頻 " 翻譯 " 出你想要的效果。

例如,這是團隊利用改進後的框架,重新生成的一段相同風格視頻,和改進前的擴散模型相比,幾乎看不出閃爍了:

14 秒生成一張關鍵幀

所以,生成一段視頻是否需要很長時間?

至少從生成幀的效率來看,速度還是不慢的,其中關鍵幀和 Stable Diffusion 出圖的速度差不多,平均在14.23 秒左右;非關鍵幀就非常快了,每幀只需要1.49 秒。

如果視頻不長、甚至只有十幾幀的話,不到一分鍾就能搞定一段視頻的轉換。

作者們将這個新框架和之前的幾類文生視頻框架進行了對比,包括 FateZero、vid2vid-zero、Pxi2Video 和 Text2Video-Zero 等,顯然新框架目前是最流暢、鬼影也最少的:

不僅僅是單純的 " 視頻翻譯 ",作者們還展示了提示詞對于視頻生成的控制效果。

例如在相同輸入下,只要更改一段提示詞中的 " 關鍵字 ",AI 就能在幾乎不改動其他元素的情況下,生成一段新的視頻,例如換個發型、換種風格,或是将狗頭換成狐狸頭:

除此之外,作者們還請來了 23 名志願者,對新框架生成的視頻質量進行了綜合評分,評估指标有三個,分别是提示詞和輸入幀的關聯度、時間一致性和視頻整體質量。

結果顯示,這個框架在 " 人類評分 " 中均取得了不錯的水平:

一作北大校友

四位作者均來自南洋理工大學。

一作楊帥,南洋理工大學助理教授,本科和博士畢業于北京大學,目前的研究方向是基于人像的編輯、文本風格化、影像翻譯等。

周弈帆,南洋理工大學研究工程師,本科畢業于北京理工大學,拿過 ACM-ICPC 金牌,研究方向包括文本挖掘、基于機器學習重建入射光場等。

劉子緯,南洋理工大學助理教授,香港中文大學博士,研究方向是計算機視覺、機器學習和計算機圖形學等。

Chen Change Loy,南洋理工大學和香港中文大學副教授,他的研究興趣集中在計算機視覺和深度學習方向,包括影像、視頻恢復和生成,以及表征學習等。

目前這個項目的代碼還沒開源,不過論文表示 " 會有的 "。

實測效果如何,我們可以期待一波。

項目地址:

https://anonymous-31415926.github.io/

論文地址:

https://arxiv.org/abs/2306.07954

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們