今天小編分享的科技經驗:豆包支持在圖片生成中文!AI 文生圖的難題終于被解決了,歡迎閱讀。
2024 年快結束了,讓 AI 在圖片上精準生成文字,并且字體和排版都好看,很大程度上還是一個難題。
我們之前測評過 Ideogram、Recraft,它們可以解決部分生成英文的需求。誇完之後,文章裡總要遺憾地補上一句——不支持中文哦。讀者們乘興而來,敗興而歸。
這不怪海外的 AI,中文的偏旁部首,本來就比英文的字母要難。
有了金剛鑽,才能攬瓷器活。生成中文的空白,終于有國内的 AI 文生圖產品填補了:字節豆包。
10 秒出圖,讓我們說中文的表情包神器
豆包的生成中文功能,目前在 app 上線,使用方法很簡單,直接就在文生圖的提示詞裡寫,你要加什麼文字。暫時還不支持,給上傳的參考圖片加文字。
經受過模拟經營遊戲《沙威瑪傳奇》洗腦的朋友,一定把那句沒有一個字在調上的「讓我們說中文」刻在腦海裡了。
那咱們也可以復刻一個手抓餅大王的店面,不同以往的是,這次真的可以說中文,紅色招牌上是工工整整的五個大字,而且 10 秒左右就搞定了。
豆包不偏科,中英搭配也可以,一個凸顯手作感的咖啡店 logo,水靈靈地誕生了。
一兩行字,或許還說明不了什麼,接下來讓我們加大難度,字要多,排版也要到位。
從《再見愛人 4》熏雞事變獲取靈感,我用提示詞給豆包下達了幾個需求。
提示詞寫得很長,但豆包聽懂了,整體的完成度很高,文案也沒有寫錯。
AI 生成具有不确定性,我反復生成了幾次,還是最滿意這張,雖然字體沒有完全符合要求,熏雞不夠寫實,小字亂碼,但畫風賞心悅目,熏雞油光水滑。
俗話說,土到極致便是潮,老年人表情包就是其中一個例子,大致包含以下特點:醒目的文字、大吉大利的元素、blingbling 的特效。
習慣了抽象和陰陽怪氣的我們,也可以學習這種有話直說的精神,比如,讓豆包生成一個「相親相愛一家人」。
貓咪、錦鯉、玫瑰、星星點點的閃光,圍繞着漸變色填充的大字,有土味復古的懷舊感了,不多,大概 40% 吧。
豆包的文生圖有一個很方便的設計——選擇風格。不用寫提示詞,點擊一下,我們就可以駕馭電影、卡通、膠片等風格。
将特殊的風格和精準生成的中文字一起用,會有事半功倍的效果。結合像素風格,我們可以讓豆包畫一個四格漫畫。
我的提示詞寫得很簡單,只是要求了每一格的文字和畫面内容,豆包給的畫面略有偏差,但文字完美,大家也可以參考這個形式,換個主題多試試。
可能有朋友會疑惑,為什麼生成中文字是個很重要的需求,不能先把圖片生成,再放在 P 圖軟體把文字打上去嗎?
這麼做當然也可以,但讓 AI 直接生成圖案和文字,風格實現無縫的适配,完全沒有 P 圖感,玩法還無窮無盡,何樂而不為?不過,消除亂碼的小字,還是用得上 P 圖軟體。
哪裡都用得上,人人都能設計海報和桌面
除了整活,豆包當然也可以做些有用的設計。一鍵生成海報、桌面、節日祝福,從此不是沒有可能了。
什麼叫有用?對于我來說,群聊的聊天背景就是一個剛需,提醒我不要在錯誤的地點講不恰當的話。
那就讓 AI 來設計一個,并要求把文字放在黃色的警示标志裡,這份打工人打工魂,豆包也應該接收到了。
我怕過年的鞭炮太響,現在就想給你新年的祝福,祥雲和元寶應有盡有。給親朋好友的紅包封面,以後不妨叫 AI 幫忙設計。
A 妹主演的、由百老匯音樂劇改編的《魔法壞女巫》正在北美熱映,國内也已經定檔,和熱度不符的,是海報的簡陋設計。
不如讓豆包重做一次,我從原海報反推提示詞,說明了畫面的要素,接下來就交給豆包。
至少,豆包做了字體設計,更貼奇幻電影的主題和氛圍,原海報反而像用 Word 和 PPT 花體字打出來的。
除了歌舞片,東方美學風格海報,豆包也可以拿捏,呈現大氣磅礴的毛筆字。
寫得好看是一方面,更重要的是豆包聽提示詞的指揮,文字是什麼風格和顏色,把字放在什麼位置,基本都能順從我們的心意。如果一次沒有,那就多生成幾次。
用豆包設計小紅書封面,圖片上下的字體和顏色可以不同,全看我們自己想要什麼效果。
豆包也能做逼真的產品圖,文字根據包裝的角度傾斜,像是印刷在包裝上。
設計 B 站長視頻的封面,當然也難不倒豆包,既專業又有親和力。
所以,技術是到位了,最重要的還是我們自己的腦洞夠不夠大,審美夠不夠好。
設計工作還無法被 AI 替代,但我們每個人最好都要有些設計思維,AI 才能更好地呈現我們的所思所想。
用 AI 產品解決問題,就選接地氣又全面的
國内率先把生成中文字的功能做進產品的,是字節的豆包,可以說,毫不意外。
豆包,是國内大模型產品中,真正既接地氣又全面的,每次推出一個新功能,都讓人覺得,這正是我需要的。
AI 寫作、AI 搜索、文檔和網頁總結,這種大模型标配的功能,豆包當然具備了。
▲用豆包生成一個類似文字冒險遊戲的對話界面
AI 智能體,豆包給了用戶海量的選擇,既能像 GPTs 那樣滿足各種垂直功能,又能類似 AI 陪伴軟體陪你聊天。
拍照搜題、語音通話、圖片生成、音樂生成、視頻生成,各色各樣的多模态功能,豆包都有。
▲用豆包生成一個小紅書流行的動物表情包
我們對于 AI 的所有核心需求,豆包基本都涉及,同時,豆包的渠道也廣闊,實現了移動端和網頁端的全覆蓋,不管是工作還是娛樂,我們都可以随時和豆包聊聊。
值得一提的是,本周豆包 PC 版将内測視頻生成功能。根據我們之前的測評,豆包的視頻生成模型,相較于 Luma、Runway 等國外產品,更懂中文和中文用戶,更适配中文互聯網中的創作工作流。
▲用豆包生成一個古早遊戲裝備欄界面,恭喜你拾取「豆包」一個。細節不完美,但有内味了
這句話放在圖片生成上也是一樣,Ideogram、Recraft 可以生成英文字固然好,但豆包率先把生成中文字的難題解決了,才真正解決了國内用戶的痛點。
不像偽文青們愛說的「你好特别,你給我一種疏離感」,「豆包」從名字到 logo 都讓人覺得格外親切,然後這種溫度也被帶入了產品的設計裡,豆包的功能都非常容易上手,主打一個新手友好,不白來,來了都能用。
中文是一門博大精深且對 AI 精準生成具有一定挑戰性的語言,這世界這麼多人,每個人都可以用 AI 設計一點什麼,無論用什麼設備,說什麼語言。AI 產品都該往這個方向進化,而先為中文用戶交出答卷的,是豆包。