大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

更懂中文還兼顧SD生态,360開源文生圖模型結構,寡姐秒變中國新娘

2024-12-19 简体 HK SG TW

今天小編分享的科學經驗:更懂中文還兼顧SD生态,360開源文生圖模型結構,寡姐秒變中國新娘,歡迎閲讀。

具備原生中文理解能力,還兼容 Stable Diffusion 生态。

最新模型結構Bridge Diffusion Model來了。

與 Dreambooth 模型結合,它生成的穿中式婚禮禮服的歪國明星長這樣。

它由 360 人工智能研究院提出,最近剛被 AAAI 接收,并已開源。

類似 ControlNet 的分支網絡思路

文生圖模型的中文原生問題,一直是一個重點研究問題。

受算力和數據因素的限制,國内大量的中文 AI 繪畫產品背後,實際上很多是以開源的英文模型及其微調模型為能力基座,但是,英文模型包括且不限于 SD1.4/1.5/2.1/3.5 以及 DALLE、Midjourney、Flux 等,因為這些模型的訓練數據以英文數據為主,因此在生成影像時,主體形象包括人物、物品、建築、車輛、服飾、标志等,都存在非常普遍和明顯的英文世界觀偏見。

BDM 是我們在多模态生成方向比較早期的工作,關注兩個關鍵問題:

1)原生中文及生成模型的世界觀偏見

2)與 SD 生态的兼容性

冷大炜博士對 BDM 工作的主要着眼點做了如上的精煉概括。

" 原生中文 " 問題指的不僅僅是文生圖模型支持中文輸入,更核心的是要求模型生成的人、物形象應該符合中文文化的認知。

下圖是 AI 繪畫模型的世界觀偏見實例,從左到右分别是 SDXL,Midjourney,國内友商 B*,國内友商 V*:

中文 AI 繪畫模型,從實現的路線選擇上,從易到難大致有以下幾種方式:

英文模型 + 翻譯。

簡單直接,除了翻譯外幾無成本。這種方式只能解決表面上的中文輸入問題,并不能解決英文模型因為模型偏見而無法生成符合中文文化認知形象的問題。

英文模型 + 隐式翻譯。

與顯式調用翻譯服務不同,這種方式是将英文模型的 text encoder 替換為中文 text encoder,并利用中英文平行語料對中文 text encoder 進行訓練,使其輸出的 embedding 空間與原來的英文 text encoder 對齊。本質上屬于一種隐式翻譯,也是成本非常低的一種方案,同樣無法解決模型的世界觀偏見問題。

英文模型 + 隐式翻譯 + 微調。

在上面方法基礎上,将對齊了 text encoder 的模型使用中文圖文數據進一步整體微調以提升模型對中文形象的輸出能力。可以在一定程度上緩解英文基底模型帶來的模型偏見問題。

中文數據從頭訓練。

這是最徹底的一種中文化方案:理解中文輸入,并能給出符合中文文化認知的影像輸出結果,可以完美解決模型的世界觀偏見問題。

上述四種路線,第 4 種路線看上去非常完美,但仍有一點值得額外的研發努力:在基座模型之外,我們需要進一步考慮的是大模型時代的模型生态問題。

圍繞着以 SD 為代表的開源模型,已形成了非常龐大的開源社區生态,這個生态中大量衍生風格模型、插件模型等積累了非常寶貴的群體智力資產。

在克服 AI 繪畫模型世界觀偏見的基礎上,進一步實現對開源社區的兼容,就是我們的 BDM 工作所要解決的第二個關鍵問題。

BDM 從模型結構上是一種類似 ControlNet 的分支網絡思路,以不同的網絡分支學習不同語言的數據,因此從原理上 BDM 不僅可以實現原生中文影像生成,也可以實現任意 X 語言的影像生成,并保證生成的影像符合對應語言文化的認知。

英文部分可以直接復用已有的開源模型,從而實現與開源社區的無縫兼容。注意 BDM 在使用時只需要輸入一種語言,比如輸入中文時,英文分支是以空文本作為輸入的。

BDM v1 版本使用 10 億量級的中文圖文數據進行訓練,并兼容 SD1.5 社區生态。

下圖展示了 BDM 在生成中文特有概念的能力和翻譯無法應對的中英多義情況下的生成效果:

下圖則展示了 BDM 在 SD1.5 社區生态兼容性上的情況,可以看到 BDM 對不同的 SD1.5 風格微調模型具有很好的兼容性,特别是 BDM 同時保持了中文形象的輸出能力,更多案例請詳見 AAAI 論文。

關于 360 人工智能研究院

在 360 集團 All in AI 的大背景下,360 人工智能研究院發揮自身的智力優勢,承擔多模态理解和多模态生成大模型(俗稱圖生文和文生圖)的戰略研發任務,并在兩個方向上持續發力,陸續研發了 360VL 多模态大模型,BDM 文生圖模型,可控布局 HiCo 模型,以及新一代 DiT 架構 Qihoo-T2X 等一系列工作。

近日,研究院在多模态理解方向的工作 IAA 和在多模态生成方向的工作 BDM 分别被 AI 領網域的 top 會議 AAAI 接收,這兩項工作的研發負責人為冷大炜博士。

據悉本屆 AAAI 2025 會議收到近 1.3 萬份投稿,接收 3032 份工作,接收率僅為 23.4%。

Arxiv:   https://arxiv.org/abs/2309.00952

Github:   https://github.com/360CVGroup/Bridge_Diffusion_Model

—  完  —

投稿請發郵件到:

[email protected]

标題注明【投稿】,告訴我們:

你是誰,從哪來,投稿内容‍

附上論文 / 項目主頁鏈接,以及聯系方式哦

我們會(盡量)及時回復你

點這裏關注我,記得标星哦~

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~  

>
熱門排行
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們