今天小編分享的科技經驗:像素蛋糕發布方糖大模型,這下修圖真的有手就行?,歡迎閲讀。
工作中有設計需求的小夥伴,估計都遇到過這樣的問題吧:
同事傳來的素材圖直接變座機畫質,根本用不了,自己鼓搗半天,出來的成品客户還是很不滿意。
好不容易拍出一張絕美素材,卻發現背景雜亂不堪,要手動塗抹的話,大半天時間就這樣過去了。
而現在有了 AI 修圖,這一切似乎都成了小 case。
3 月 31 日,像素蛋糕召開春季發布會,帶來了像素系列產品的多項新功能。會上,像素蛋糕重磅發布了行業首個應用級影像大模型——方糖大模型,專注于為攝影師、修圖師及影像創作者解決攝影修圖場景的復雜難題。
(圖源:像素蛋糕)
根據官方介紹,不同于大夥現在常見的通用大模型,攝影垂直領網域的方糖大模型有幾大核心效果優勢:
其一,懂攝影,會思考,方糖大模型能讀懂一張照片的攝影構圖、景深、光影、紋理、風格,以 "AI 祛路人 " 為例,像素蛋糕在該應用場景中的檢測與分割精準度,以及祛除與生成還原度等指标上均表現良好,對比 Adobe Photoshop 2025 及 iPhone 16 Pro Max 實現了不同程度的領先。
其二,好操作,響應快,像素蛋糕無需指令,復雜問題一步搞定,仍以「AI 祛路人」為例,它的操作簡單到甚至只需一個步驟,幾秒間就能完成路人檢測、框選、塗抹、擦除、修補、融合等多個費時費力的修圖步驟。
其三,更專業,更可控,不同于通用影像大模型的高度随機性,方糖大模型雖然簡化了功能操作,但仍保留了專業級的控制選項,全流程可編輯,可以控制面部、手部、背景等影像細節的精确性,實現了更高的控制度。
如今,全球 AI 領網域重心出現轉移,市場開始聚焦垂類應用。
這個發展路徑并不意外,從歷史上看,科技行業的變革往往遵循一定的階段性規律。
以互聯網時代為例,最初受益的是 " 賦能者 ",如半導體公司,然後進入基礎設施的層面,包括雲計算、電力供應相關的企業,最後才是應用和服務層面,如抖音、微信、美團等。
這個思路放在 AI 時代同樣适用,通用大模型建立了基礎設施,而基于通用大模型所衍生出來的垂類應用,則會真正将 AI 價值釋放出來,當技術回歸場景本質,AI 如何真正落地解決特定場景的實際問題,是這場競賽的突圍關鍵點。
在我看來,方糖大模型的出現,算是彌補了國產大模型在語義 AI 修圖應用這塊的空白。
可以預見的是,随着 AI 影像編輯技術的不斷發展,未來手機、電腦都可能會集成這項功能,就像 AI 消除、AI 擴圖那樣走進尋常百姓家。無論是小白還是大咖,每個人都有機會輕松上手使用,讓自己對美的理解可以更直觀地展現出來。
修圖有手就行?或許真的不是夢。