今天小編分享的互聯網經驗:美圖大模型,如何讓AI更懂“美學”?,歡迎閲讀。
試想下,未來你要做一個產品評測視頻,但距離交稿日期只有兩天。而你完全沒有創作思路,一筆沒動,但你卻一點不着急,慢條斯理地用讓小白直接在手機中簡單操作開拍 APP,根據產品外觀,輸入提示器來智能生成口播腳本文案,之後再利用有 " 全鏈路 " 解決視頻創作的 WHEE 平台根據提示器,生成腳本文案截圖作為場景展示交給客户。
客户審核通過後,利用 AI 數字人工具 DreamAvatar 來生成虛拟主播,并再次使用開拍 APP 進行視頻口播拍攝,這時候已經過了一天,產品外觀沒拍一張,于是你利用美圖設計室 2.0X-Design 來先進行 AI 智能摳圖,再使用 AI 作圖來制作出一張融合進背景的產品外觀圖,之後使用專業用户創作 WinkStudio 進行視頻剪輯,最後使用美圖 AI 助手 RoboNeo 對視頻進行 AI 修正。
最後,恭喜你,終于提前 2 小時完成了整個視頻制作。
以上的場景并不是 " 空穴來風 ",借助美圖第二屆影像節發布的 AI 新品,上述場景很可能走入尋常百姓家。
未來憑借你 " 個人之力 ",就能單獨包攬從腳本創作到最終視頻輸出的所有工作,一個人可以身兼腳本文案專員、攝影攝像、編導、視頻剪輯等職位,而且還能大幅縮減工作時間,對于個人創作者或者小型團隊,絕對是一個不可多得的福利。
而能夠完成這些工作的底層核心,就是美圖影像節的 "one more thing"AI 視覺大模型 MiracleVision 奇想智能。
那相較于已有的大模型產品,美圖有什麼與眾不同?
和已有的大模型不同,美圖強調這是一款 " 懂美學 " 的大模型,通過邀請藝術家、專業資深美學背景研究學者,來共同探讨和研究美學趨勢,還會和 " 懂美學 " 的創作者一起共建生态。
但是在我看來,美圖對于 AI 視覺大模型 MiracleVision 奇想智能還是有些樂觀,雖然可以通過模型訓練來提升創作的 " 美感 ",通過模型分發來優化模型,但想要快速商業化還需要持續探索。
此外,對于 " 懂美學 " 這個詞,就有一定的局限性,美圖所講的 " 美學 " 風格是什麼?号召各個藝術家一起商讨美學趨勢本身就是 " 各路開花 " 結果,大家審美取向并不一樣。
那麼,美圖大模型對 " 美 " 的理解又是什麼樣呢?
或許可以從 " 國潮 " 中可以找到答案。
作為國内第一家開啓中國傳統文化數字傳播系統工程的企業,美圖公司持續推動影像科技創新,持續将傳統文化中的色彩、紋樣、妝容等融入現代元素并進行數字化呈現。
這些探索積累大大的幫助了美圖的視覺大模型更好的理解什麼是 " 國風國潮 "。近年來,美圖公司陸續推出了一系列以影像數字化方式演繹 " 國風國潮 " 的傳統文化項目 ," 中國潮色 "、" 國潮紋樣 "、" 東方潮妝 " 等項目,诠釋中國美學。
在理解 " 國風國潮 " 上的基礎上,美圖對傳統影像進行多維度的特征提取和分類,結合 " 國風國潮 " 本身獨特的色彩配色方案,将概念轉化為影像視覺方案。同時結合多年的技術積累,在通過對影像精準化控制基礎上,讓視覺大模型進行學習,去真正做到理解 " 國風國潮 "。結合我們視覺大模型本身對語義理解、亞洲人像的背後審美探索等的優勢,使得對于國風元素的識别、理解和生成,都具有更高的準确性和創造性。
但我發現在現場展示的根據 AI 提示詞來創作國潮人物的學習過程中,在我看來,三個月前的創作形象似乎要比經過大量模拟學習的人物更有個性。
需要注意到的是,美應該是主觀的,不被定義的,如果經過三個月乃至更長時間訓練出的 AIGC 内容能更讓人耳目一新,想必更能體現出 " 懂美學的大模型 " 的價值。
不能否認美圖利用 AI 視覺大模型 MiracleVision 作為底層為自家應用產品帶來的便捷,但如果從模型底層就開始為 " 美 " 做定義,這是否就背離了藝術應該有的自由、随機特征?
顯然,美圖在構建這一產品之初,就考慮到了關于 " 美 " 的多樣性,即 " 美是多樣的 ",通過大模型的海量案例去生成不同人眼中的美,而非偏向于任何一種風格。
此外,美圖的 MiracleVision 是國内首個 " 懂美學 " 的 AI 視覺大模型,如何去具體理解?
适當量化和合作參與是其 " 殺手锏 "。
" 美圖把長期積累的美學趨勢研究融入 MiracleVision 視覺大模型,并搭建了基于機器學習的美學評估系統,為模型生成結果打上 " 美學分數 ",從而不斷地提升模型對美學的理解。此外,MiracleVision 視覺大模型具備獨特的美學創作者生态,有藝術家、設計師等具有深厚美學背景的專業人士,共同參與到視覺大模型的建設中。"
眾所周知,相關研發需要強大的技術支持。在影像節後,品玩記者對美圖公司創始人、董事長兼首席執行官吳欣鴻 ( 以下簡稱 " 吳總 " ) 進行了群訪,在提到美圖在技術研發上進行了哪些投入時。
吳總稱:" 美圖 AI 相關布局始于 2010 年,通過成立 MT Lab ( 美圖影像研究院 ) 聚焦計算機視覺。自 2013 年開始重點投入深度學習,2016 年即推出 AIGC 的產品雛形 " 手繪自拍 ",廣受全球用户歡迎。2022 年 11 月以來,美圖 AIGC 產品進入爆發期。2022 年,美圖公司研發投入達人民币 5.86 億元,同比 2021 年增長 7.5%。"
由此可見,美圖早于十幾年前就着手布局 AI 相關產業,而且随着時代和市場環境的不斷變化,在這一領網域的投入也逐年遞增。那麼,這麼大的投入已經取得了怎樣的回報呢?
據悉,美圖在 AIGC 相關產品的技術研發上有比較大的投入,全面進行資源傾向。一方面不斷吸引相關技術人才加入美圖,也對原有技術人員進行培訓更新;另一方面也加強算力方面的投入。吳總表示,目前美圖的很多 AIGC 應用場景有已經被驗證的商業模式,用户願意為 AIGC 產品訂閲或單購。
在 AI 的驅動下,截至 6 月 18 日,美圖公司的全球 VIP 會員數從去年影像節公布的 450 萬增長至 719 萬。"VIP 會員數的快速增長,也讓我們去年的訂閲收入首次超過廣告收入,開啓了美圖商業化的第二曲線。未來,美圖将持續進行科技創新探索,結合用户需求研發 AIGC 新品。" 吳欣鴻説。
美圖 MiracleVision 視覺大模型,有 " 技術和人 " 持續蓄勢
與市面上大部分視覺大模型有所不同,MiracleVision 視覺大模型具有強大的視覺表現力和創作力,并從繪畫、設計、影視、攝影、遊戲、3D、動漫等視覺創作場景反推技術演化。
然而,好的視覺大模型需要有良好的 " 模型生态 " 支撐,這個過程離不開創作者和開發者的持續參與。在采訪中我們得知,美圖為創作者提供創作支持,例如像課程、社區和模型創作大賽等。創作者訓練的模型,可以在美圖旗下產品進行分發,在分發的過程中還能持續進行模型優化。行業客户可以通過 MiracleVision 它的 API 或 SDK 進行商業使用,創作者和開發者也可以從中獲得經濟收益。
" 在 AI 與影像生產力工具的緊密結合下,優質内容的創作門檻将不斷降低,很多行業的生產效率也将不斷提升。美圖将秉持着 " 讓科技與藝術美好交匯 " 的使命,不斷為用户帶來更優質的產品與服務。" 吳欣鴻表示。