變身“神筆馬良”，國產AI只需要15秒 - 大酷樂

今天小編分享的财經經驗：變身“神筆馬良”，國產AI只需要15秒，歡迎閱讀。

出品｜虎嗅科技組

作者｜餘楊

編輯｜苗正卿

頭圖｜視覺中國

8 月 29 日， Midjourney 宣布将涉足硬體領網域，并在社交媒體 X 上發布消息廣攬人才，來充實其新成立的硬體部門。

AI 繪畫似乎要卷出新形态。

這并不奇怪。Midjourney 創始人 David Holz 曾任 Leap Motion 的首席技術官，具備豐富的硬體經驗。他的前同事——現為 Midjourney 硬體部門負責人—— Ahmad Abbas 也曾在蘋果公司工作過五年，擔任硬體經理，參與了 Vision Pro 頭顯的研發。

在此之前，我曾問過一眾美術、設計相關專業的從業者，Midjourney 對 ta 們來說意味着什麼。得到最多的答案是：靈感。

而對非藝術專業的，比如我，或是為了配插圖，或是出于好奇，抽卡自娛，也彌補彌補應試教育那些年沒能開發自己藝術細菌的遺憾。

但由于 Midjourney 的使用有一定的門檻（比如魔法，比如一些些米），也勸退了不少人。

好在，随着 AI 產品的國產化，國内大模型的 AI 繪畫也成長了起來。那麼今天，我們就來橫向測評幾個國產文生圖的 AI 模型，并靜候 AI 繪畫的新形态。

今天參與測評的玩家有：快手可靈 AI、字節即夢 AI、商湯秒畫。

為了更好地揭示各家大模型的所長，測評的系列則混合人像、繪畫、寫實、3D、再創作等幾個方面。

考慮到方便對比，接下來即以系列主題為綱，所生成的條目按可靈、即夢、秒畫的順序排列，影像比例都設定為 1:1，其他參數默認。

最後，結合操作過程中的使用體驗和特點給出總評，着急的朋友可以直接下拉到操作體驗和總評環節。

人像

1. 攝影，中景，穿着傳統漢服的中國女性，手持折扇，優雅含笑，在古典園林中漫步。

2. 特寫，夜景，時尚芭莎雜志，金發碧眼的歐洲女孩，黑色夾克，酷辣風格，站在巴黎埃菲爾鐵塔前，手裡有一杯咖啡。

從人像模塊可以看到，第 1 個 prompt 裡，我的命令是手持折扇，即夢給了我一個團扇；

第 2 個 prompt 裡，三家似乎都沒有 get 到我金發碧眼的命令，生成的圖片都是藍瞳。

繪畫

1. 中國水墨畫，" 孤舟蓑笠翁，獨釣寒江雪 "，意境悠遠，雲霧缭繞。

2. 人物臉部速寫，鉛筆畫，中年男子，穿着宇航服，有着愛因斯坦一樣吐舌頭的表情。

繪畫的功力在第 1 個 prompt 裡其實高下立見。

第 2 個 prompt 裡沒有秒畫的圖并不是我漏了，而是秒畫提示我非法字元，我換掉了 " 愛因斯坦 " 和 " 臉部 "，都沒有成功生成，姑且這樣，也提醒一下想借助 AI 完成工作的朋友，把此類不确定因素考慮在内。

寫實

1. 動物：一只威武的獅子，卧在非洲大草原上，慵懶地曬着太陽。

2. 車：一輛經典的老爺車，行駛在 60 年代的美國公路上，周圍是廣闊的沙漠景觀。

在寫實這個版塊，獅子的光影層次可靈表現得更好。

秒畫似乎并沒有 get 到 " 寫實 " 的味道，保持着繪畫的風格。不過，後面也會說到，相對于可靈沒得選，即夢 6 種迭代模型外，秒畫有着 29 種基模型可以選擇風格化的定制生圖。

不知道哪位選手畫出了你心中的老爺車。

3D 虛拟

1. 動漫風格，一位擁有超能力的動漫少女，眼睛閃爍着神秘光芒，背景是未來都市。

2. 動畫風格，一個充滿魔法書籍的圖書館，書架上的書籍漂浮在空中，書架之間有魔法生物在穿梭。

在這個版塊，除了提示詞所要求的魔法生物外，即夢是唯一畫出了人的形象的 AI。

再創作

在這個版塊，我原本想看看 AI 生圖的想象力和對文化的理解能力，順便把我喜歡的影視作品中 be（bad ending）的遺憾變成 he（happy ending），但是 ……。

prompt1：畫一個至尊寶和紫霞仙子在一起的結局。

但是沒想到我也 be 了，嗯，還是别在一起了。

我想再給 ta 們一次機會，考慮到我說得不夠确切，不死心的我再次輸入一個 prompt。

prompt2：畫一個《海上鋼琴師》中主角 1900 最終上岸了的生活場景。（雖然我也站不上岸）

好的，我明白了，涉及人文領網域，AI 多半要 be。

不過，我樂于見到的是，創造力這種東西，仍然屬于人類。AI 或許能夠提供靈感，但它的純文本想象力，目前仍然止步于為人類打輔助。

再創作也向我再次确證，只有與人類發生關聯的一切才有意義。

操作體驗

首先是功能區一覽，我把可靈、即夢和秒畫的操作區拼在了一起。

從操作上看，三位選手都是支持墊圖的，可靈和秒畫都可以選擇生成 1 張 or 多張，即夢只能一次性生成 4 張，再從中選出自己中意的圖。

即夢和秒畫同時支持調節比例和尺寸，可靈只支持調節比例。

從使用體驗感來說，可靈和秒畫的生成速度大約在 15 秒，即夢有時耗時 20 秒，有時耗時一分多鍾，并且發生這種情況的概率是 3:7。不過，它生成的圖也更多。

如果氪金的話，可靈在圖片生成之後，還可以進一步畫質增強，而 " 生成視頻 " 這個按鈕，将一鍵直達 " 圖生視頻 "，也就是說，在 sora 的中間插了一步畫面風格選擇。

即夢生成圖片之後，除了同樣可以生成視頻之外，支持畫布編輯、超清圖、細節修復、局部重繪、擴圖和消除筆等功能。

而秒畫，則在 prompt 的細節上有着較為 "Midjourney" 的表現，如優化提示詞、負向提示詞以及加速模式等，大有對标 Midjourney 的意圖。

值得一提的是，除了上述的 29 個基模型，在模型廣場中，一共呈現了 74 個不同風格的模型（包含 29 個基模型在内）。

公平起見，在上述測評中，我使用的仍然是默認的 Artist v1.0 Alpha 模型。大家在使用時可以自取所需，反復探索。

總評環節

總的來說，可靈、即夢和秒畫在 AI 繪畫這個產品上各有特點。

在我看來，人像模塊，可靈對中國面孔有着更好的理解，更少的 " 網紅感 "，更多的東方味道。外國面孔，秒畫有着更好的細節。

繪畫裡，三位選手對傳統詩歌内容都有着較好的理解能力，秒畫對水墨畫的藝術概念更清晰，但在人像速寫中，可能會出現不穩定的情況，可靈則表現得更好。

寫實中，可靈和即夢都理解了需求，而秒畫似乎還沉浸在繪畫的命令裡。

3D 虛拟版塊，三家難分伯仲，不難理解，AI 繪畫為何會成為創作者的靈感來源。

再創作領網域，可能需要提前墊圖，不然可能會得到相當魔性的畫風。AI 的理解力，尚未延伸到我們的文化生活。

使用門檻上，三家的操作都較為流暢，可靈和即夢有着基礎 66 分左右的靈感值（通行貨币名稱），省着點用，可靈可以生成大約 300 次，即夢 60 多次，兩者每天籤到都送積分。秒畫則是每天免費 10 次生成，更多次數或可邀請好友一起領 3 天無限卡。