今天小編分享的财經經驗:變身“神筆馬良”,國產AI只需要15秒,歡迎閱讀。
出品|虎嗅科技組
作者|餘楊
編輯|苗正卿
頭圖|視覺中國
8 月 29 日, Midjourney 宣布将涉足硬體領網域,并在社交媒體 X 上發布消息廣攬人才,來充實其新成立的硬體部門。
AI 繪畫似乎要卷出新形态。
這并不奇怪。Midjourney 創始人 David Holz 曾任 Leap Motion 的首席技術官,具備豐富的硬體經驗。他的前同事——現為 Midjourney 硬體部門負責人—— Ahmad Abbas 也曾在蘋果公司工作過五年,擔任硬體經理,參與了 Vision Pro 頭顯的研發。
在此之前,我曾問過一眾美術、設計相關專業的從業者,Midjourney 對 ta 們來說意味着什麼。得到最多的答案是:靈感。
而對非藝術專業的,比如我,或是為了配插圖,或是出于好奇,抽卡自娛,也彌補彌補應試教育那些年沒能開發自己藝術細菌的遺憾。
但由于 Midjourney 的使用有一定的門檻(比如魔法,比如一些些米),也勸退了不少人。
好在,随着 AI 產品的國產化,國内大模型的 AI 繪畫也成長了起來。那麼今天,我們就來橫向測評幾個國產文生圖的 AI 模型,并靜候 AI 繪畫的新形态。
今天參與測評的玩家有:快手可靈 AI、字節即夢 AI、商湯秒畫。
為了更好地揭示各家大模型的所長,測評的系列則混合人像、繪畫、寫實、3D、再創作等幾個方面。
考慮到方便對比,接下來即以系列主題為綱,所生成的條目按可靈、即夢、秒畫的順序排列,影像比例都設定為 1:1,其他參數默認。
最後,結合操作過程中的使用體驗和特點給出總評,着急的朋友可以直接下拉到操作體驗和總評環節。
人像
1. 攝影,中景,穿着傳統漢服的中國女性,手持折扇,優雅含笑,在古典園林中漫步。
2. 特寫,夜景,時尚芭莎雜志,金發碧眼的歐洲女孩,黑色夾克,酷辣風格,站在巴黎埃菲爾鐵塔前,手裡有一杯咖啡。
從人像模塊可以看到,第 1 個 prompt 裡,我的命令是手持折扇,即夢給了我一個團扇;
第 2 個 prompt 裡,三家似乎都沒有 get 到我金發碧眼的命令,生成的圖片都是藍瞳。
繪畫
1. 中國水墨畫," 孤舟蓑笠翁,獨釣寒江雪 ",意境悠遠,雲霧缭繞。
2. 人物臉部速寫,鉛筆畫,中年男子,穿着宇航服,有着愛因斯坦一樣吐舌頭的表情。
繪畫的功力在第 1 個 prompt 裡其實高下立見。
第 2 個 prompt 裡沒有秒畫的圖并不是我漏了,而是秒畫提示我非法字元,我換掉了 " 愛因斯坦 " 和 " 臉部 ",都沒有成功生成,姑且這樣,也提醒一下想借助 AI 完成工作的朋友,把此類不确定因素考慮在内。
寫實
1. 動物:一只威武的獅子,卧在非洲大草原上,慵懶地曬着太陽。
2. 車:一輛經典的老爺車,行駛在 60 年代的美國公路上,周圍是廣闊的沙漠景觀。
在寫實這個版塊,獅子的光影層次可靈表現得更好。
秒畫似乎并沒有 get 到 " 寫實 " 的味道,保持着繪畫的風格。不過,後面也會說到,相對于可靈沒得選,即夢 6 種迭代模型外,秒畫有着 29 種基模型可以選擇風格化的定制生圖。
不知道哪位選手畫出了你心中的老爺車。
3D 虛拟
1. 動漫風格,一位擁有超能力的動漫少女,眼睛閃爍着神秘光芒,背景是未來都市。
2. 動畫風格,一個充滿魔法書籍的圖書館,書架上的書籍漂浮在空中,書架之間有魔法生物在穿梭。
在這個版塊,除了提示詞所要求的魔法生物外,即夢是唯一畫出了人的形象的 AI。
再創作
在這個版塊,我原本想看看 AI 生圖的想象力和對文化的理解能力,順便把我喜歡的影視作品中 be(bad ending)的遺憾變成 he(happy ending),但是 ……。
prompt1:畫一個至尊寶和紫霞仙子在一起的結局。
但是沒想到我也 be 了,嗯,還是别在一起了。
我想再給 ta 們一次機會,考慮到我說得不夠确切,不死心的我再次輸入一個 prompt。
prompt2:畫一個《海上鋼琴師》中主角 1900 最終上岸了的生活場景。(雖然我也站不上岸)
好的,我明白了,涉及人文領網域,AI 多半要 be。
不過,我樂于見到的是,創造力這種東西,仍然屬于人類。AI 或許能夠提供靈感,但它的純文本想象力,目前仍然止步于為人類打輔助。
再創作也向我再次确證,只有與人類發生關聯的一切才有意義。
操作體驗
首先是功能區一覽,我把可靈、即夢和秒畫的操作區拼在了一起。
從操作上看,三位選手都是支持墊圖的,可靈和秒畫都可以選擇生成 1 張 or 多張,即夢只能一次性生成 4 張,再從中選出自己中意的圖。
即夢和秒畫同時支持調節比例和尺寸,可靈只支持調節比例。
從使用體驗感來說,可靈和秒畫的生成速度大約在 15 秒,即夢有時耗時 20 秒,有時耗時一分多鍾,并且發生這種情況的概率是 3:7。不過,它生成的圖也更多。
如果氪金的話,可靈在圖片生成之後,還可以進一步畫質增強,而 " 生成視頻 " 這個按鈕,将一鍵直達 " 圖生視頻 ",也就是說,在 sora 的中間插了一步畫面風格選擇。
即夢生成圖片之後,除了同樣可以生成視頻之外,支持畫布編輯、超清圖、細節修復、局部重繪、擴圖和消除筆等功能。
而秒畫,則在 prompt 的細節上有着較為 "Midjourney" 的表現,如優化提示詞、負向提示詞以及加速模式等,大有對标 Midjourney 的意圖。
值得一提的是,除了上述的 29 個基模型,在模型廣場中,一共呈現了 74 個不同風格的模型(包含 29 個基模型在内)。
公平起見,在上述測評中,我使用的仍然是默認的 Artist v1.0 Alpha 模型。大家在使用時可以自取所需,反復探索。
總評環節
總的來說,可靈、即夢和秒畫在 AI 繪畫這個產品上各有特點。
在我看來,人像模塊,可靈對中國面孔有着更好的理解,更少的 " 網紅感 ",更多的東方味道。外國面孔,秒畫有着更好的細節。
繪畫裡,三位選手對傳統詩歌内容都有着較好的理解能力,秒畫對水墨畫的藝術概念更清晰,但在人像速寫中,可能會出現不穩定的情況,可靈則表現得更好。
寫實中,可靈和即夢都理解了需求,而秒畫似乎還沉浸在繪畫的命令裡。
3D 虛拟版塊,三家難分伯仲,不難理解,AI 繪畫為何會成為創作者的靈感來源。
再創作領網域,可能需要提前墊圖,不然可能會得到相當魔性的畫風。AI 的理解力,尚未延伸到我們的文化生活。
使用門檻上,三家的操作都較為流暢,可靈和即夢有着基礎 66 分左右的靈感值(通行貨币名稱),省着點用,可靈可以生成大約 300 次,即夢 60 多次,兩者每天籤到都送積分。秒畫則是每天免費 10 次生成,更多次數或可邀請好友一起領 3 天無限卡。