可把馬斯克二次元化？「最強文生圖開放模型」Stable Diffusion免費來襲！

今天小編分享的科學經驗：可把馬斯克二次元化？「最強文生圖開放模型」Stable Diffusion免費來襲！，歡迎閲讀。

Stable Diffusion 最強版本，來了！

剛剛，SDXL 1.0 正式發布，可免費在線試玩。

效果上，無論是以假亂真的寫實大片：

超現實的熊貓喝啤酒：

還是賽博朋克漫畫，都非常 nice~

Stability AI 表示，SDXL 1.0 能生成更加鮮明準确的色彩，在對比度、光線和陰影方面做了增強，可生成100 萬像素的影像（1024 × 1024）。

而且還支持在網頁上直接對生成影像進行後期編輯。

（有一股和 Midjourney、Firefly 打擂台的味兒了）

網友們已經按捺不住上手試玩了 ~

和基礎 Stable Diffusion 相比，SDXL 1.0 生成結果更加準确和逼真。

而且官方表示，提示詞也能比之前更簡單了。

這是因為 SDXL 1.0 的基礎模型參數量達到了35 億，理解能力更強。

對比基礎版 Stable Diffusion，參數量只有 10 億左右。

由此，SDXL 1.0 也成為當前最大規模的開放影像模型之一。官方甚至直接説這就是世界上最好的開放影像模型。

話不多説，我們來上手體驗了 ~

SDXL 1.0 在操作上很便捷，直接輸入 prompt 即可，還能從下面勾選風格、尺寸參數等。

一次生成默認是出 4 張圖，如果不滿意還可以點下方 " 加号 " 讓它繼續畫。

官方介紹説，現在讓 SDXL 1.0 生成大作，無需再加入 " 傑作 " 這種提示詞了。

讓它生成一幅日漫風格的影像，畫風非常貼合，而且在光影的處理上也更加自然了。

1990s anime low resolution screengrab couple walking away in street at night

或者是一幅風景照？也能以假亂真了。

甚至是讓馬斯克站在中式庭院裏，抬頭斜望着天空……

Elon Musk in an ancient Chinese palace

或者是把蘋果收購了？

在「WWDC」上，他舉着全新款 iPhone 向人們展示，身邊還圍滿了記者和粉絲（doge）。

Elon Musk releasing new iPhone at WWDC

除了這些老馬的洋葱新聞之外，繪畫風格的作品效果也不錯。

左邊的是齊白石水墨風格，而右邊是一幅漫畫。

左：Elon Musk delivering a speech, ink painting, Qi Baishi style

右：Elon Musk comic

除了繪畫，也可以把老馬放進我們的元青花。

Elon musk in the shape of Yuan Dynasty Blue and White Porcelain

上面展示的這些「老馬的故事」，用的 prompt 都比較簡單。

但從效果并沒有因為提示詞簡單而拉胯，這也與官方的説法相印證。

不過我們還是想看看，如果用更加復雜精致的 prompt，會是什麼樣子？

我們找到了 Midjourney 創作的一張老馬在蘇聯擔任汽修工人的珍貴照片，重新喂給 MJ，讓它生成個 prompt。

MJ 生成了下面這樣的 prompt，我們就用它來測試 SDXL：

Elon Musk ( 這裏 MJ 生成的是 a man ) standing in a workroom, in the style of industrial machinery aesthetics, deutscher werkbund, uniformly staged images, soviet, light indigo and dark bronze, new american color photography, detailed facial features

風格完全符合我們的預期，細節也還不錯。

再來一個復雜 prompt 的圖作為收尾，同樣是 MJ 根據此前的作品生成後喂給 SDXL。

elon musk eating food with chopsticks, in the style of peter coulson, cross-processing/processed, pinhole photography, herb trimpe, james tissot, transavanguardia, spot metering

左邊是 SDXL 的作品，右邊是 MJ 的原版，大家可以對比一下。