大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

無需參數訪問!CMU用大模型自動優化視覺語言提示詞

2024-11-07 简体 HK SG TW

今天小編分享的科學經驗:無需參數訪問!CMU用大模型自動優化視覺語言提示詞,歡迎閲讀。

視覺語言模型(如 GPT-4o、DALL-E 3)通常擁有數十億參數,且模型權重不公開,使得傳統的白盒優化方法(如反向傳播)難以實施。

那麼,有沒有更輕松的優化方法呢?

就在最近,卡内基梅隆大學(CMU)的研究團隊對于這個問題提出了一種創新的" 黑盒優化 " 策略——

通過大語言模型自動調整自然語言提示詞,使視覺語言模型在文生圖、視覺識别等多個下遊任務中獲得更好的表現。

這一方法不僅無需觸及模型内部參數,還大幅提升了優化的靈活性與速度,讓用户即使沒有技術背景也能輕松提升模型性能。

該研究已被 CVPR 2024 接收。

如何做到的?

大多數視覺語言模型(如 DALL-E 3、GPT-4o 等)并未公開模型權重或特征嵌入,導致傳統依賴反向傳播的優化方式不再适用。

不過,這些模型通常向用户開放了自然語言接口,使得通過優化提示詞來提升模型表現成為可能。

然而,傳統的提示詞工程嚴重依賴工程師的經驗和先驗知識。

例如,為提升 CLIP 模型的視覺識别效果,OpenAI 花費了一年時間收集了幾十種有效的提示詞模板(如 "A good photo of a [ class ] ")。

同樣,在使用 DALL-E 3 和 Stable Diffusion 等文生圖模型時,用户往往也需掌握大量提示詞技巧才能生成滿意的結果。

那麼,有沒有替代人類提示詞工程師的方法?

有的 CMU 團隊提出了一種新策略:用 ChatGPT 等大語言模型自動優化提示詞。

像提示詞工程師利用反饋改進提示詞一樣,CMU 的方法将正負反饋交給 ChatGPT,以更高效地調整提示詞,具體過程如圖所示:

這種優化過程類似于機器學習中的" 爬山法 "(hill-climbing)策略,不同之處在于大語言模型可以自動分析提示詞表現,從正負反饋中找到最優改進方向。

研究團隊利用這一特性來更高效地優化提示詞。這個過程可以用以下步驟概括:

提示詞初始化:收集一批未經優化的初始提示詞。

提示詞排序:對當前提示詞進行表現評分,保留高分提示詞,替換低分提示詞。

生成新提示詞:通過大語言模型,根據提示詞的表現生成新的候選提示詞。

經過多輪迭代,最終返回得分最高的提示詞作為優化結果。

實驗結果

通過這一方法,CMU 團隊在無需人類提示工程師參與的情況下,在多個小樣本視覺識别數據集上取得了最佳準确性,甚至超越了傳統的白盒提示詞優化方法(如 CoOp)。

此外,該方法在無需了解數據集内容的前提下,自動捕捉到了下遊任務的視覺特性并将其融入提示詞中,取得了更好的效果。

例如,在食物識别任務中,ChatGPT 自動将提示詞調整為識别 " 多樣化的美食和原料 ",從而提升了模型的表現。

研究團隊還證明了,通過 ChatGPT 黑盒優化得到的提示詞不僅适用于單一模型架構,還能在不同模型架構(如 ResNet 和 ViT)之間泛化,并且在多種模型上表現優于白盒優化得到的提示詞。

這一系列實驗證明,大語言模型能夠從提示詞的性能反饋中提取出隐含的 " 梯度 " 方向,從而實現無需反向傳播的模型優化。

在文生圖任務中的應用

CMU 團隊進一步探索了該方法在生成任務中的應用潛力。

在文本到影像生成(T2I)任務中,ChatGPT 能夠自動優化提示詞,從而生成更符合用户需求的高質量影像。

例如,對于輸入描述 " 一個動物注視着一個人 ",系統可以通過逐步優化提示詞來提升生成影像的準确性。

此外,這一方法還适用于提示反演(Prompt Inversion)。

提示反演是一種根據現有影像反推生成模型輸入提示詞的技術,簡單來説,就是通過影像生成能夠再現其特征的文本描述(提示詞)。

研究團隊在復雜的文本到影像任務上進行了測試,結果表明這一方法僅需三輪提示詞優化,就能顯著提高用户的滿意度。

此外,研究團隊還指出,提示反演可以幫助用户快速定制特定的影像效果,例如 " 讓這只狗變成站立姿勢 " 或 " 讓背景變成夜景 ",從而生成符合特定需求的影像。

CMU 團隊表示,提出的黑盒優化範式突破了傳統模型調優的限制,不僅在影像分類和生成任務中表現出色,還展示了廣泛的應用潛力。

這一方法無需訪問模型權重,僅通過 " 文本梯度 " 實現精準優化,具備強大的擴展性。

未來,黑盒優化有望應用于實時監控、自動駕駛、智能醫療等復雜動态場景,為多模态模型的調優帶來更加靈活高效的解決方案。

團隊介紹

團隊的一作劉士弘(Shihong Liu)是卡内基梅隆大學的研究生畢業生,曾任機器人研究所研究員。

目前在 北美 Amazon 工作,負責大型分布式系統的計算和大語言模型驅動的 AI Agent 的開發。

△劉士弘(Shihong Liu)

團隊的共同一作林之秋(Zhiqiu Lin)是卡内基梅隆大學的博士研究生,專注于視覺 - 語言大模型的自動評估與優化。

Zhiqiu Lin 在 CVPR、NeurIPS、ICML、ECCV 等頂級會議上發表了十數篇論文,并曾榮獲最佳論文提名和最佳短論文獎等。

△林之秋(Zhiqiu Lin)

Deva Ramanan教授是計算機視覺領網域的國際知名學者,現任卡内基梅隆大學教授。

△Deva Ramanan 教授

他的研究涵蓋計算機視覺、機器學習和人工智能領網域,曾獲得多項頂級學術榮譽,包括 2009 年的 David Marr 獎、2010 年的 PASCAL VOC 終身成就獎、2012 年的 IEEE PAMI 青年研究員獎、2012 年《大眾科學》評選的 " 十位傑出科學家 " 之一、2013 年美國國家科學院 Kavli Fellow、2018 年和 2024 年的 Longuet-Higgins 獎,以及因其代表性工作(如 COCO 數據集)獲得的 Koenderink 獎。

此外,他的論文在 CVPR、ECCV 和 ICCV 上多次獲得最佳論文提名及榮譽獎。他的研究成果對視覺識别、自動駕駛、和人機互動等應用產生了深遠影響,是該領網域極具影響力的科學家之一。

  CVPR ’ 24 論文鏈接 :  

https://arxiv.org/abs/2309.05950

  論文代碼 :  

https://github.com/shihongl1998/LLM-as-a-blackbox-optimizer

  項目網站: 

https://llm-can-optimize-vlm.github.io

—  完  —

投稿請發郵件到:

[email protected]

标題注明【投稿】,告訴我們:

你是誰,從哪來,投稿内容‍

附上論文 / 項目主頁鏈接,以及聯系方式哦

我們會(盡量)及時回復你

點這裏關注我,記得标星哦~

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~  

>
熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們