今天小編分享的科技經驗:魔改「黑神話悟空」,打敗 Midjourney,這個 AI 生圖神器讓人上頭,歡迎閱讀。
當 AI 文生圖比拼真實度、藝術感,Ideogram 開辟了一個刁鑽的賽道:在圖片上精準生成文字,并且字體和排版都好看。
這個需求并不小眾,一鍵生成海報、插畫,還不用 P 圖,能夠省不少事,很适合對設計一竅不通的普通人。
我們之前寫過 Ideogram 的 1.0 版本。8 月 21 日,2.0 版本來了,真實感更好了,海報更有設計感了,文字這個看家本領也更強了。
你或許從來沒有聽說過它,這是一款前 Google 員工開發的 AI 產品,缺點不少,但長板能「彎道超車」Midjourney。
指路 https://ideogram.ai/
AI 想知道,你說的悟空,是哪個悟空
Ideogram 有個特别新手友好的功能:「魔法提示」。
你直接輸入中文提示詞,它會幫你翻譯成英文,同時幫你優化。作為一款海外產品,這樣的操作很能收買人心。
同時,Ideogram 主打五種風格:普通、寫實、設計、3D、動漫,都很好理解,所以選擇起來也不會讓人糾結。
先來個簡單的中文提示詞,「拿着金箍棒的孫悟空」,動漫風格,讓 AI 幫我翻譯和優化,看看它能自由發揮成什麼模樣。
當水靈靈的《七龍珠》版悟空出來的時候,我驚了一下,一看提示詞,AI 把孫悟空翻譯成了「Son Goku」,那就不奇怪了。
而且,也很想問問 Ideogram,是不是太明目張膽,給版權費了麼。
為了避免 AI 再誤解,再輸入提示詞的時候,我不偷懶了,強調「孫悟空」是「Sun Wukong」,不是「Son Goku」。
這次走寫實風格,并且規定了比較詳細的場景,大聖身穿铠甲,手拿金箍棒,神情肅穆,威風凜凜,站在佛窟前,溫暖的橙色調,圖片底部寫着「Black Myth: Wukong」(黑神話:悟空)。
文字沒有錯誤,大寫字母衝擊感強,佛窟的氛圍也營造了三分,但「大聖」的氣質差了點、形象返祖了點,眼神裡也沒有光。
用相同的提示詞讓 Midjourney 生成一次,文字既有錯誤又沒設計感,但稍帥一籌的「大聖」和頁遊的畫風彌補了這一點。
▲ Midjourney 生成
不甘心的我又試了 3D 風格,提示詞基本保持不變,只是把底部的文字改成了「8 月 20 日遊戲上線」。
結果,Ideogram 生成的結果很像某個國風 Q 版盲盒系列的宣傳圖,畫面處理得很幹淨,但完全不是我腦海裡的 3D 遊戲風格,還把美猴王畫出了二郎神的模樣。
并且 AI 也從中暴露了自己,雖然它對英文的文字渲染得心應手,卻對中文一竅不通,這個缺陷從 1.0 延續到了 2.0。
看來海外產品不夠理解國内的傳統文化,Ideogram 第一回合的表現有些令人失望,卻也不失趣味。
Ideogram 團隊說過,2.0 版本不輸 Flux 和 DallE。最近,Flux 真實版 LoRA 生成的 TED 演講照片因為真假難辨,騙過了不少網友的眼睛。那麼就來測測,Ideogram 生成的結果能多像照片。
▲ Flux 生成
選擇寫實風格後,我輸入了中文提示詞,TED 演講照片,幻燈片标題為「Ideogram 2.0 發布」,上面有三個要點:「文字準确」「擅長設計」和「更真實」,女性演講者站在白板前,背景中有幾個人。
可以看出,Ideogram 的語義理解是不錯的,該有的元素都有,TED 的标志幾乎以假亂真,演講者和觀眾的表情都很生動,頭發和皮膚比較自然。
不過,細節處理得還不夠好,雖然要求生成的文字沒有問題,随機出現的一些小字壞了一鍋粥,人物的手指和身體也不太對勁,但已經比之前的 1.0 版本強太多了。
至于海報設計,可以說是 Ideogram 吊打其他文生圖 AI 的「舒适區」了。
如果以票房異常火爆的《異形:奪命艦》為考題,AI 能設計出那種不可名狀的恐怖感覺嗎?
我選擇了設計風格,用提示詞描述了一下畫面的要素,并特别提及,海報底部寫上一句:「未成年觀眾謹慎觀看。」
總體的效果讓人眼前一亮,長串的文字也成功生成了,只有一處小錯誤,但特别不寫實,更像美漫的畫風,和真人電影不太相配。
我再以暑期檔爛片《紅樓夢之金玉良緣》為靈感,讓 Ideogram 生成海報,提示詞寫到的背景、裝飾物乃至人物都在其中了,再次感嘆提示詞的跟随性真的不錯。
片名當然也寫對了,但字體像借鑑了指環王,有些出戲,整體風格更像花木蘭動畫電影。
Ideogram 的「設計風格」偏向二次元,比較獨特,但反過來想,這也局限了海報的使用場景。
小結一下,Ideogram 是一款很有自己特色的 AI 文生圖產品,寫實的水平和 Flux 相近,藝術感和 Midjourney 各有千秋。
▲ 「rainy summer」圖案
但文字生成水平獨一檔,比較适合用來生成海報、插畫、廣告、表情包、T 恤印花等。
人類評估的結果顯示,Ideogram 2.0 在提示詞對齊、整體表現和文本渲染質量方面,都比 Flux Pro 和 DALL · E 3 更好。
▲ 但這是 Ideogram 自己的說法
可玩性高又接地氣,這樣的 AI「甜品」不妨多來一些
去年 8 月 22 日,Ideogram 宣布成立,與 2.0 發布正好相隔一年。
創始團隊共 7 人,來自 Google Brain、加州大學伯克利分校、卡内基梅隆大學和多倫多大學,其中 4 位是 Google 文生圖擴散模型 Imagen 研究論文的作者。
這次除了發布 2.0,Ideogram 還推出了 iOS app,國内可以直接下載,Android 版計劃稍晚發布,從網頁到移動端,我們可以随時随地生成圖片了。
▲ 手機端界面
Ideogram 目前向所有用戶免費開放,不過,額度非常有限,生成 5 次共 20 張照片後,Ideogram 就提醒我,10 個積分用完了,請明天再來。(當然,隔壁的 Midjourney 免費生成 25 張也沒有顯得多大氣。)
如果很少接觸文生圖,想要一款文生圖 AI 用來入門的,Ideogram 是個不錯的選擇。
輸入中文提示詞、用「魔法提示」翻譯和優化是一方面,另外,Ideogram 還有很多選項幫你生成更接近腦海所想的畫面。
提供範圍有限的選項讓用戶「點擊」,相比在空白的輸入框完成「輸入」,互動起來更簡單。想要什麼圖片比例、什麼風格、什麼色調,Ideogram 都可以讓你挑選。
▲ 不同色調的「戴珍珠耳環的少女吃麥當勞」
不會寫提示詞,那也可以畫出來,讓 Ideogram 幫我們化腐朽為神奇。
我為我的糟糕畫工感到抱歉,但 AI 能夠領會意思,優化了線條和上色,還加了個背景,格調一下子上去了。有了 AI,誰不是神筆馬良。
另外,網頁版的輸入框下面,都是他人生成的作品,遇到喜歡的,我們可以查看和參考提示詞。Ideogram 表示,他們的用戶在過去一年生成了超過 10 億張公開可見的圖片。
如果想要生成一個特定的對象,但又不知道怎麼寫提示詞,Ideogram 這次還推出了用文本搜索公共創作庫的功能,但這個功能目前需要會員。
▲ 搜索「cat」的結果
總而言之,Ideogram 是一款可玩性較強的文生圖產品。
它可以比較精準地生成用戶所需的文字内容,并适配各種風格的圖片,就業領網域很廣。
▲ Ideogram 博客
偶爾還能帶來情緒價值,以圖言志,雖然做的表情包太偏歐美互聯網的審美了。
▲ 「我想玩《黑神話:悟空》」表情包
Ideogram 的整體質量不差,文本功能強大,對新手友好,使用方便,互動也讓人愉悅。當 AI 工具兼具了創意、便利和分享價值,就很容易讓人上頭。
一個照着模子刻出來的世界太無聊了,洞察到很小的需求,然後将解決辦法做到行業第一,那也很有意思。
世界上有很多的產品,同時有更多的閱聽人,我們可以期待更多這樣的 AI「甜品」。