今天小編分享的科技經驗:百度知識圖譜部總監佘俏俏:AIGC正在颠覆現有的内容生產方式,歡迎閲讀。
本文來源:時代周報 作者:齊鑫
人工智能技術的發展,給内容生產創作帶了影響和變革。
7 月 28 日,2023 ChinaJoy AIGC 大會在上海舉辦,本次大會的主題為 "AI 新範式,内容生產新世代 "。會上,《數字互動引擎的應用與價值研究》報告發布,來自國内外 AIGC 行業的專家、學者及從業者分享了對于 AIGC 技術給内容產業帶來的變革思考,探讨了行業發展新趨勢。
随着 ChatGPT 火爆全球,人工智能技術随之掀起一陣高潮,國内外多家科研機構、企業、高校等相繼發布了多個大模型產品,将 AIGC 技術推向了新高度。AIGC 技術改變了内容的創作方式,提升了内容生產的能力。例如,遊戲是内容與科技結合的成果,人工智能技術能有效提升遊戲研發效率、創新能力,給玩家帶來全新的遊戲體驗。
會上,百度知識圖譜部總監佘俏俏進行了題為《AIGC 技術助力視覺創作新業态》的主題演講,分享了百度 AIGC 技術與應用上的進展和思考。
(圖片來源:活動方供圖)
"AIGC 正在颠覆現有的内容生產方式,以十分之一的成本,以百倍千倍的速度生成 AI 原創的内容,它不僅會提升内容生產的效率,也會創造出獨特的價值和獨立視角的内容,從而帶來内容生產、内容消費模式的突破。" 佘俏俏表示。
佘俏俏以百度目前在該領網域推出的產品和應用技術為例,從圖片生成、視頻生成兩方面分享了她的觀察和看法。
文心一格是百度于 2022 年 8 月發布的一款依托于百度飛槳、文心大模型技術的 AI 繪畫產品,能夠為專業創作者提供創作靈感,也能為文字創作者提供高質量配圖,為大眾提供了一個零門檻創作繪畫平台。
據佘俏俏介紹,文心一格的背後是百度自研的一套基于知識與大模型的文生圖系統,這套文生圖系統是基于昆侖芯、飛槳、文心大模型、百度知識圖譜構建的,全棧技術自研,自主可控。智能 Prompt 工程能很好地理解用户的需求,構建出适合于 AI 繪畫的輸出表示。基于輸出,跨模态大模型會生成能夠滿足用户需求同時兼具美感和實用性的影像。平台還具備影像編輯能功能,讓用户能夠對影像進行調整。在流程中,各個模塊都充分利用用户反饋持續進行優化迭代。
在視頻内容創作方面,佘俏俏表示,視頻素材質量和豐富程度決定了最終效果,而獲取高質量視頻素材主要有跨模态匹配、跨模态生成兩種方法。
" 但無論是哪種方法,最核心的技術難題是如何實現文本、圖片、視頻片段等不同模态之間的語義級對齊。" 佘俏俏稱,團隊在業界首次提出了基于統一建模的視文一體跨模态大模型,解決了這一業界難題。具體而言,百度創新整合了包括語言、視覺、語音、跨模态等一系列技術能力,參考了人在視頻創作過程中的策、采、編,實現了文案理解與生成、素材分析與處理、素材擴充與編排等步驟,自動生成視頻,在這套系統基礎上實現了輔助的視頻創作系統。
AIGC 技術又給視覺内容創作的帶來了哪些新變化?
據佘俏俏觀察,AIGC 技術提升了内容創作的效率,顯著降低了不同形式視覺内容創作的整體成本和制作時間。同時,AIGC 技術能夠助力用户将想象付諸于實現,為用户提供更多創意。此外,AIGC 技術能夠降低創作門檻,讓更多人加入到視覺内容創作中來。
佘俏俏認為,未來,大模型與知識技術将推動 AIGC 的效果進一步提升。在算法層面,大模型将進一步統一更多模态、任務、場景;在算力層面,将硬體利用率進一步提高,并且形成更高性能的能力;在數據層面,将從之前更多強調規模轉向更強調質量,以及與模型打造更好的迭代閉環;在知識層面,更強調精準、更多形态,在 AI 推理和決策中發揮更重要的作用。
" 這些技術的持續提升,将使 AIGC 技術具有更強的語言互動界面,更好的自主可控性、可解釋性,生成更高維度的時空内容。" 佘俏俏表示,将 AI 與人類的創造力結合在一起,可以開拓視覺内容的廣闊未來。