今天小編分享的科技經驗:像做PPT一樣做短視頻和直播?,歡迎閱讀。
讓創意被激發,讓創作更簡單
文 | 陳首丞
編 | 石燦
8 月 10 号的快手光合創作者大會上,高管圓桌環節開始前,一笑、于越、Thomas 和笑古分别在視頻中做了自我介紹。
只不過,視頻中出現的并非真人,而是 " 一笑分笑 "、" 于越分越 "、"Thomas 分托 " 和 " 笑古分古 " ——快手高管們的數字人分身。
這些真假難辨的數字人,來自快手首次公開的 AIGC 數字人解決方案:快手智播,可以低成本創建數字人直播,制作數字人短視頻。用戶只需 3-5 分鍾的少量視頻素材,用時 3 天花費千元,就可制成孿生數字人。目前,快手智播可在本地消費、本地生活、電商直播等多種場景落地。
正如快手 AI& 用戶增長業務負責人王仲遠所說:身處這場 AI 技術變革之中,我們堅信 AIGC 将賦予普通用戶更多的創作權力和自由,也堅信 AIGC 将成為短視頻内容生產的基礎設施。
數字人,用在哪?
在直播帶貨的達播領網域,人貨場仍然是不可切分的緊密三角,數字人很難取真人而代之。但在非達播的場景,數字人有廣闊的應用空間,且能大幅提升從業者的工作效率。
據了解,僅以快手為例,AI 數字人在本地生活、本地消費、24 小時店播和海外商業素材生產等場景有廣泛的應用,且曝光轉化率等核心指标和大盤相比高達 203%。
以快手的快聘業務為例,快手智播月均生產數字人素材上千條,以中低粉段達人拍攝視頻為基準計算,單條短視頻創作成本降低到人工成本的 5% 以下。
顯然,同樣是招聘,在傳統的招聘平台上發布文字信息的成本,要遠遠低于在短視頻平台制作視頻的成本。在更早的時期,這一問題限制了招聘的短視頻化和本地生活化,讓有招聘需求的一方望而卻步。
但 AI 數字人的誕生和快手智播的存在,讓客戶可以像做 PPT 一樣做視頻和直播,僅需輸入文案,就可配置視頻,再通過快手的算法分發邏輯,将視頻推送給廣大有潛在需求的人群。這不僅利用了快手的用戶量和算法優勢,又将招聘方的成本降到了合理的程度。
招聘之外,AI 數字人在一些領網域的表現也堪稱優秀。比如本地生活,有服務商一次性投入五十個以上的賬号進行開播,一個月内有效總直播時長達 11640 小時,帶來了 1.1 萬個訂單和近百萬的 GMV,轉化率是真人的兩倍,且成本還要更低。
其中,滬上吃喝玩樂花花系列賬号某快餐漢堡套餐單品一個月賣出近 3000 份;某遊樂園全日門票單品一個月賣出 30 萬元,實際核銷率接近 60%,近似真人直播效果。
至于直播帶貨的店播場景,在更早期的時間裡,就有将 24:00-6:00 的時間段交給虛拟主播,用以保持直播間的 24 小時運營和基礎商品介紹功能的案例。24 小時的 AI 數字人直播間則是更加激進的嘗試,這一方面是因為數字人建模的能力在提升,達到了 " 真假難辨 " 的地步,另一方面也是因為店播本身的特殊屬性:" 貨 " 比 " 人 " 要更重要。
24 小時店播的效果也不比真人要差,以美妝店鋪泉兮旗艦店為例,數字人測試直播半個月期間,人均觀看、3s 播放率、轉化效率和商品訪問下單率均比該直播間真人主播表現更好,每場直播 GMV 貢獻近萬元。
花西子直播間也同樣使用了數字人主播,并對數字人的效果表示:" 很多客戶提問交流,有可能我們效果太逼真,用戶沒看出是數字人,還是會問很多問題,我們也能迅速回復。"
在這種情況下,AI 數字人也就有了大展身手的空間。更低的成本和更好的效果,讓 AI 數字人更具競争力。
3 分鍾,3 天,千元成本 AIGC 數字人的三個關鍵詞
數字人并非一個新鮮產物,在生成式 AI 進入該領網域之前,就已經有一些數字人 IP 獲得了不小的成功。
2021 年開始,與元宇宙概念相關的虛拟偶像率先出圈,如 A-soul、柳夜熙和狐璃璃等,他們往往有大平台扶持的背景,且都吸引了不小的聲量,其中,A-soul 主要成員 " 嘉然今天吃什麼 " 是 B 站百大 UP 主,柳夜熙在抖音擁有超 800 萬粉絲,狐璃璃在快手擁有超 400 萬粉絲,均是平台頭部創作者。
不過,這批 3D 數字人 IP,在商業化路徑上仍然走的是傳統流量經濟的老路,收入來源以直播打賞或者廣告代言為主,這與其制作方成本的投入并不匹配。而且," 中之人 " 的存在,也讓這批數字人 IP 面臨一定的 " 塌房 " 風險,難以成為真正的 " 數字 " 偶像。行業中也曾有過專為直播帶貨而生的 IP,如遙望科技旗下的數字偶像 " 孔襄 ",不過該數字人目前已經停更,鮮有新動向。
行業中更加廣泛存在的,則是數量龐大的 2D 數字人,在更早的時間段主要服務于政府、金融等行業,C 端用戶則無明顯感知。2023 年開始,在生成式 AI 技術的加持下,有了爆發性的增長。
一批公司也因此吃到了行業增長的紅利,在抖音平台,虛拟人創業公司矽基智能已經服務了上萬個客戶,主要聚集在本地生活和直播電商領網域,也進入了 C 輪融資階段,是數字人直播領網域的頭部公司。
此外,行業内還有定位 SaaS 版本視頻剪輯工具,專門服務于地方電視台,銀行,國家機關和地方政企的騰訊智影,以及主要給政務,金融客戶提供定制化解決方案的百度靈犀和給短視頻賬号公司服務的閃剪等等。
除了定位于營銷場景的政企、傳媒、金融行業之外,短視頻和直播帶貨的數字人需求往往聚焦于垂類,比如短視頻中的口播場景以及直播帶貨中的标品店播場景,這部分内容對人的表現力需求不強,因此能夠由數字人完美取代。
基于此,快手自研的 AIGC 數字人解決方案快手智播有着天然優勢,其與快手業務系統的深度打通,能更好的為快手生态服務。比如其完美匹配快手的直播系統和風控系統,還能自動挂車和切換講解卡,同時回答觀眾的提問,和觀眾實時互動,這一過程又進一步節省了人力的使用。
最低只需要 3 分鍾的視頻和音頻素材,用時 3 天,就可以制作相應的數字孿生形象,同時快手還将提供整套的 SaaS 服務工具,不需要用戶另外采購任何硬體設備,只需輸入短視頻文案或者直播稿,就可一鍵生成視頻或開播。這套流程在當前的技術能力下,僅需千元即可完成,而此前傳統數字人制作費用一般需 10 萬元以上。
據快手技術人員介紹,為了達到目前的拟真度,快手基于自研高精度 3D 面部重建算法進行了 3D 建模,還在數萬小時的模特數據上進行了訓練,又針對每個具體模特進行了微調。
而為了實現實時性,快手還有自研的推理引擎、部署框架、以及在多個業務中得以迭代的流式的數字人生成框架,能夠以秒級的低延遲實現數字人直播。
數字人背後,快手布局全模态大模型 AIGC
實際上,數字人產品只是快手 AIGC 系列部署中的一環,在光合大會上,王仲遠強調了一個概念:全模态、大模型 AIGC。
他表示:創作本身是一件需要創意和專業度的事情,持續創作優質作品會讓很多創作者感到壓力。以一個美食創作者為例,分享一道或十道拿手菜并不是難事,但長期堅持下去,總會在創意、素材和視頻制作等方面遇到難題。
而所謂的全模态、大模型 AIGC 解決方案,就是為了解決創作者在創作過程中的各種痛點而生。據王仲遠介紹,這套方案可以幫助創作者更好的激發創意,用戶只需一個指令,就可以讓大模型幫助自己完成故事撰寫、腳本整理,并能夠基于場景主題生成對應的圖片和配樂。用戶不用再絞盡腦汁反復腦暴,可以讓大模型提供更多的靈感和創意。
在大會上,王仲遠還展示了大模型的素材繪制功能,針對周傑倫創作的歌曲《七裡香》,大模型自動畫出了相關畫面,這也就意味着,創作者在使用快手大模型的時候,可以自由地提供場景描述來獲得素材,最終簡化創作視頻的流程。在電商場景上,大模型也可以幫助 B 端創作者将所售商品進行 3D 化展示,進一步提升消費體驗。
甚至,傳統視頻直播中費時費力門檻頗高的剪輯工作,也可以由快手大模型的 AIGC 解決方案取代。創作者只要自行上傳相關素材,就可以得到相應的短視頻内容。
此前,不少大模型產品都是針對某項具體的場景應用,譬如對話提供相應的文字解決方案或者 AI 智能生成圖片。而快手的全模态、大模型 AIGC,不只定位于個别功能,而是聚焦于用戶在快手的各種需求,讓用戶在創作視頻和帶貨的每一步都能得到 AI 的幫助。
而這,顯然更符合 AI 誕生的本意,AI 出現,不是為了取代誰的工作,而是幫助人類把工作變得更簡單。全模态 AIGC 如此,快手智播這一產品更是如此。在以人為核心,以創作者為核心的基本價值觀下,相信每一個快手的創作者,都可以用好 AI,在快手獲得更好的創作體驗。