今天小編分享的互聯網經驗:阿裡巴巴的新模型AnyText:動動嘴就能1分鍾做出一張電商大促海報,歡迎閱讀。
眾所周知,如何在畫面中輸出文字一直是文生圖大模型的弱項。不過最近阿裡巴巴做的新模型 AnyText 給了這個難題一個解。
比如給出 Prompt:" 一張鋼筆的電商廣告,上邊寫有 " 雙 12 大促!"," 出水流暢 "," 立即發貨 "," 包郵 "," 立減 50"。" 很快就能生成下面這張圖片:
甚至不用修改都能直接當作電商圖片來使用了。
目前,AnyText 支持中英日韓四種語言。該項目在魔搭社區放出了 Demo ,可以通過部署到本地使用,也可以直接在魔搭社區試用。
給出 Prompt:" 一面藍色的牆,用中英日韓四種語言寫着 "happy,快樂,ジョイフル,즐거운 "",之後 AnyText 給出了這張圖片:
看起來好多了,雖然文字還有點怪。再換一個主題試一試,正好南方小土豆這個梗正火,我們跟着小土豆去哈爾濱看看:
效果不錯,甚至讓人覺得 AnyText 在文字輸出能力這方面秒了當前最強的 Midjourney。要知道前不久剛剛更新的 Midjourney 還只能輸出簡單的英文,而且效果也只能說一般。
能通過理解 Prompt 之後,給出恰當的圖案,同時輔以恰當的文字,整體不說藝術性有多高,但實用性是拉滿了。至少做表情包又多了一個途徑。
由 AnyText 生成
AnyText 目前提供兩種功能,一個是圖片生成,一個是圖片編輯。顧名思義,圖片生成就是根據用戶的描述來生成一張帶有文字的圖片,而圖片編輯可以讓 AI 幫助用戶改變現有的圖片中的文字。
圖片編輯是 AnyText 一個非常實用的功能,只要将想要修改的圖片上傳,并在想要修改或添加文字的地方塗抹,同時寫上提示詞就可以對圖片中的文字進行修改。既可以改變現有的文字内容,也可以單獨為圖片增加文本。
上圖為 AnyText 修改後的效果,下圖為原圖
左圖為原圖,右圖為修改後的效果
圖片編輯這個功能可以在很大程度上提高各位美工老師修改圖片的速度。不過有了 AnyText 之後,以後恐怕大家還要加倍小心來判斷圖片中内容的真假了。
而另一個就是圖片生成功能,這其實是 AnyText 的主要功能,可以在一定程度上取代平面設計的工作。用戶除了需要提供提示詞之外,還可以對文字出現的位置進行調整。AnyText 在這方面提供了三個不同的模式,分别是随機、手繪和拖框。
手繪模式可以讓用戶随機選擇文字出現的位置,如果對于文字位置沒有太好想法的用戶,還可以利用拖框功能拖出一個長方形文本框,讓 AI 在框内随機發揮。
手繪
拖框
如果想不到合适的位置,也可以直接選随機,讓 AI 自行安排。
選好文字位置,我們就可以輸入提示詞,并調整圖片的參數。讓我們來看看更多 AnyText 生成的圖片效果吧:
在随機模式下提出要求:生成一張 1980 年的報紙,标題是 " 新報 "
在手繪模式下輸入:一個橢圓形的銘牌,寫有 " 姓名:羅建成,ID:0875"
在手繪模式下輸入:生成一個未來感的 LOGO,标有 "GENAI 新世界 "
在拖框模式下輸入:一幅古典人物畫像,标有固體詩文 " 知否知否,應是綠肥紅瘦 "
随機模式下輸入:畫一個水果裝飾的奶油蛋糕,下方寫有 " 生日快樂 "
在拖框模式下輸入:一張兒童蠟筆畫,森林中有一座糖果屋,标題是 " 糖果屋 "
在手繪模式下輸入:一位大媽站在公告板前,寫有 " 安全生產 "
各種圖片證明,AnyText 的文字表達能力和同行比起來挺強的,不管是中文還是英文都能清晰地讓人辨認出來,甚至連古體字也能輕松表現。
但這就讓人感覺非常遺憾了,因為在它的文字輸出能力面前,AnyText 的圖片内容質量和理解能力都跟不上。這讓 AnyText 像一個偏科生,雖然有一項表現特别出色的科目,但整體成績平平。這比那些哪哪都不行的模型更讓人覺得可惜。
AnyText 還有一個很大的問題,就是生成時間的問題。雖然很多圖片生成模型都需要一定的時間來生成内容,但沒有像 AnyText 耗時這麼長的。基本上一組圖片生成需要耗時 3 — 4 分鍾,甚至有的圖片生成時間超過了 5 分鍾。而 AnyText 自己給出的預估時間常與實際花費時間矛盾,讓用戶覺得等待時間更久。而且 AnyText 是不是還會出現 Bug,讓用戶必須重新生成圖片。
還有一點,AnyText 雖然可以改變圖片的分辨率、強度、種子數、風格等專業參數,但這方面引導做的并不好,如果不是随意點開,許多人幾乎都找不到改變參數的位置。生成式大模型都發展一年了,這些基礎功能還需要人自己挖掘,這點挺令人遺憾的。
總體來說,AnyText 并不算一款成熟的產品,雖然在文字輸出方面有着自己的優勢,但就目前的圖片質量而言,想要投入實際使用恐怕還是要好好訓練一段時間。