大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

CVPR‘24:文生圖提示詞自動優化,還發現三個小竅門,人大度小滿等機構出品

2024-07-02 简体 HK SG TW

今天小編分享的科學經驗:CVPR‘24:文生圖提示詞自動優化,還發現三個小竅門,人大度小滿等機構出品,歡迎閲讀。

文生圖也有自己的 prompt 優化工具了。

我們都知道,大模型輸出的質量,很大程度上依賴于輸入的 prompt。尤其在文生圖領網域,對于 prompt 格外敏感。

來自中國人大、度小滿等團隊提出了一種全新的自動文本提示優化方法——動态提示自動編輯(Prompt Auto-Editing,PAE)。

它考慮了文本提示中的每個詞在擴散生成過程的權重和注入時間步。

最終在多個公開數據集上進行了實驗驗證,包括 Lexica.art、DiffusionDB 和 COCO。PAE 方法不僅提高了影像的美學質量,還确保了影像與文本描述的語義一致性。

與傳統方法相比,PAE 在控制影像生成過程中的精确性和靈活性方面表現更優。

當前,盡管用户可以通過手動修改提示來嘗試生成更優質的影像,但這一過程不僅效率低下,而且難以精确控制。

為了提高效率并優化生成結果,團隊研發了 PAE 方法,這一方法的關鍵在于采用了動态提示(Dynamic Prompts)。

首先是為用户輸入的簡短提示詞擴充出更多修飾詞,其次是通過動态調整新添加的修飾詞的權重和注入時間步,自動細化優化文本提示,從而更精準地控制影像生成過程。

1、Dynamic Prompt 的定義

具體來説,團隊定義了一種新的提示格式,用以豐富初始提示的信息,命名為動态精細控制提示(DF-Prompt)

文本 prompt 中的每個 token 會被拓展成一個三元組,在原有基礎上新添加了用來添加權重的浮點數,以及文本生效的時間步範圍。

DF-Prompt 是原本的提示詞和修飾詞的結合。DF-Prompt 的本質在于促進更精确和控制的生成。為了便于演示和代碼實現,我們還定義了一個純文本格式: [ token:range:weight ]

以 portrait of a beautiful forest goddess, beauty, very aesthetic, masterpiece 為例,其中 beauty 拓展成三元組可以表示為 [ beauty:0.5 → 0:0.75 ] ,其權重為 0.75,生效的時間步範圍為後 50% 的降噪步驟。

2、訓練數據收集

DiffusionDB 數據集收集了用户生成影像時使用的 prompt,其中包含大量的修飾詞、風格描述等,可以幫助我們訓練提示詞拓展與精細優化的自動化模型。

在 DiffusionDB 等數據集中,一般逗号之前的文本包含主要信息,描述影像的主題,而逗号之後的文本被視為次要文本,提供補充後綴作為修飾語。

比如 "a red horse on the yellow grass, anime style",主要信息為 "a red horse on the yellow grass",次要文本為 "anime style"。

我們把逗号之前的文本作為短提示,剩餘的文本 ( 次要文本 ) 形成了修飾詞集合,以此來構建訓練數據中的輸入提示詞和目标提示詞。

最後,我們定義一個置信分數,利用美學指标和 CLIP 分數來篩選訓練數據,确保用于訓練的提示詞能夠引導生成高美學評分、高圖文對齊度的影像。

3、訓練階段

如圖所示,使用收集好的訓練數據進行兩階段訓練。

階段一:監督式微調階段。

在收集好的數據集上對語言模型進行微調,以生成優化後的文本提示。每條訓練數據都包含了短提示詞文本和修飾詞集合,這裏的優化目标就是讓語言模型根據短提示詞擴展出更多修飾詞。在這種方式中,訓練好的模型能夠處理簡短的提示,并預測适當的修飾詞,從而提升生成影像的美學質量。

階段二:強化學習階段。

使用強化學習優化文本提示,通過多維度獎勵系統來指導這一過程,考慮到美學評分、語義一致性和用户偏好。這一階段的主要目的是為每一個修飾詞添加權重和作用時間步,實現精細化的控制。我們使用 PPO 算法,在訓練集上最大化期望累積獎勵。獎勵函數是在生成的影像上計算的,考慮了包括 CLIP 分數、PickScore、美學評分等指标。

通過觀察自動學習到的權重分布、時間步範圍統計信息,我們還有了一些有趣的發現:

使用藝術家名稱和紋理修飾詞:通過引入藝術家的名字和紋理修飾詞,可以顯著提高生成影像的藝術質量,并保持語義的準确性。

在擴散過程的後半階段引入風格元素:在影像生成的擴散過程後半段引入風格化元素,可以更好地融合這些元素,從而提高整體的視覺和藝術效果。

降低復雜術語的權重:對于復雜的術語,适當降低其權重可以确保影像生成既平衡又具吸引力,避免過分強調某些元素,從而影響影像的整體美觀。

arxiv 鏈接:  https://arxiv.org/abs/2404.04095

代碼鏈接:  https://github.com/Mowenyii/PAE

—  完  —

投稿請發郵件到:

[email protected]

标題注明【投稿】,告訴我們:

你是誰,從哪來,投稿内容‍

附上論文 / 項目主頁鏈接,以及聯系方式哦

我們會(盡量)及時回復你

點這裏關注我,記得标星哦~

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~  

>
熱門排行
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們