Stable Diffusion團隊放大招！新繪畫模型直出AI海報，實現像素級影像生成 - 大酷樂

今天小編分享的科學經驗：Stable Diffusion團隊放大招！新繪畫模型直出AI海報，實現像素級影像生成，歡迎閲讀。

開源 AI 繪畫扛把子，Stable Diffusion 背後公司StabilityAI再放大招！

全新開源模型DeepFloyd IF，一下獲星 2 千 + 并登上 GitHub 熱門榜。

DeepFloyd IF 不光影像質量是照片級的，還解決了文生圖的兩大難題：

準确繪制文字。（霓虹燈招牌上寫着 xxx）

以及準确理解空間關系。（一只貓照鏡子看見獅子的倒影）

網友表示，這可是個大事，之前想讓 Midjourney v5 在霓虹燈招牌上寫個字 AI 都是瞎劃拉兩筆，對于鏡子理解的也不對。

使用 DeepFloyd IF，可以把指定文字巧妙放置在畫面中任何地方。

霓虹燈招牌、街頭塗鴉、服飾、手繪插畫，文字都會以合适的字體、風格、排版出現在合理的地方。

這意味着，AI 直出商品渲染圖、海報等實用工作流程又打通一環。

還在視頻特效上開辟了新方向。

目前 DeepFloyd IF 以非商用許可開源，不過團隊解釋這是暫時的，獲得足夠的用户反饋後将轉向更寬松的協定。

有需求的小夥伴可以抓緊反饋起來了。

像素級影像生成

DeepFloyd IF 仍然基于擴散模型，但與之前的 Stable Diffusion 相比有兩大不同。

負責理解文字的部分從 OpenAI 的 CLIP 換成了谷歌T5-XXL，結合超分辨率模塊中額外的注意力層，獲得更準确的文本理解。

負責生成影像的部分從潛擴散模型換成了像素級擴散模型。‍‍

也就是擴散過程不再作用于表示影像編碼的潛空間，而是直接作用于像素。

官方還提供了一組 DeepFloyd IF 與其他 AI 繪畫模型的直觀對比。

可以看出，使用 T5 做文本理解的谷歌 Parti和英偉達 eDiff-1也都可以準确繪制文字，AI 不會寫字這事就是 CLIP 的鍋。

不過英偉達 eDiff-1 不開源，谷歌的幾個模型更是連個 Demo 都不給，DeepFloyd IF 就成了更實際的選擇。

具體生成影像上 DeepFloyd IF 與之前模型一致，語言模型理解文本後先生成 64x64 分辨率的小圖，再經過不同層次的擴散模型和超分辨率模型放大。

在這種架構上，通過把指定影像縮小回 64x64 再使用新的提示詞重新執行擴散，也實現以圖生圖并調整風格、内容和細節。

并且不需要對模型做微調就可直接實現。

另外，DeepFloyd IF 的優勢還在于，IF-4.3B 基礎模型是目前擴散模型中U-Net 部分有效參數是最多的。

在實驗中，IF-4.3B 取得了最好的 FID 分數，并達到 SOTA（FID 越低代表影像質量越高、多樣性越好）。

誰是 DeepFloyd

DeepFloyd AI Research 是 StabilityAI 旗下的獨立研發團隊，深受搖滾樂隊平克弗洛伊德影響，自稱為一只 " 研發樂隊 "。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

主要成員只有 4 人，從姓氏來看均為東歐背景。

這次除了開源代碼外，團隊在 HuggingFace 上還提供了 DeepFloyd IF 模型的在線試玩。

我們也試了試，很可惜的是目前對中文還不太支持。

原因可能是其訓練數據集 LAION-A 裏面中文内容不多，不過既然開源了，相信在中文數據集上訓練好的變體也不會太晚出現。

One More Thing

DeepFloyd IF 并不是 Stability AI 昨晚在開源上的唯一動作

語言模型方面，他們也推出了首個開源并引入 RLHF 技術的聊天機器人 StableVicuna，基于小羊駝 Vicuna-13B 模型實現。

完整的桌面和移動界面也即将發布。

Deepfloyd IF 在線試玩：

https://huggingface.co/spaces/DeepFloyd/IF

代碼：

https://github.com/deep-floyd/IF

StableVicuna 在線試玩：

https://huggingface.co/spaces/CarperAI/StableVicuna

參考鏈接：

[ 1 ] https://deepfloyd.ai/deepfloyd-if

[ 2 ] https://stability.ai/blog/deepfloyd-if-text-to-image-model

[ 3 ] https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

[ 4 ] https://stable-diffusion-art.com/how-stable-diffusion-work/

熱門排行

王治郅：楊瀚森主要的問題是速度他的速度跟郟君昊 | 2025-05-05
貿易戰燒進電影院：特朗普拟重税打擊外國電影習又夏 | 2025-05-05
貸款追高炒黃金的人後悔了！有人一天虧掉6年寸飛蘭 | 2025-05-05
手機電池突破8000mAh？硅碳技術的回旋镖：「折衛青柏 | 2025-05-05
貸款追高炒黃金的人後悔了！有人一天虧掉6年繁綺文 | 2025-05-05
任天堂對Genki提起Switch 2商标侵權訴訟，後郜萌運 | 2025-05-05
哪吒汽車APP和官網恢復正常知情人士：之前斷袁曼雁 | 2025-05-05
極越汽車 CEO 夏一平名下青島/義烏兩家公司集玲琳 | 2025-05-05
全國經濟第一大省明确，推動組建農商聯合銀行佼昌翰 | 2025-05-05
桑保利：亞馬爾有配合意識&有點像梅西姆巴佩甄正浩 | 2025-05-05
高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
曹操墓，裏面都有啥？衛青柏 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
解除資格！停止一切合作佼昌翰 | 2023-05-02
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
200户連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容温柔郜萌運 | 2023-05-02