今天小編分享的互聯網經驗:AI數字人,告别「印鈔機」年代,歡迎閱讀。
文 | 矽基研究室,作者 | kiki
2024 年 3 月,數字人服務商阿傑清晰記得在公司舉辦的一場分享會上,不大的會議室裡擠滿了焦慮的老板們。焦慮被包含在具體的問題裡—— " 無人直播是不是就是錄播?"" 創始人 IP 怎麼變現?"" 矩陣批量直播怎麼幹?"
最高峰時,他記得自己一天接到十幾個咨詢,接待過四五波實地考察的客戶,最終成交的訂單也很可觀,那是大模型的應用熱下 AI 數字人作為「淘金地」的一個縮影,流傳在圈裡的 GMV 神話繼續放大行業的樂觀,有人形容這是數字人的「印鈔機年代」。
從行業看去,2024 年也是數字人借大模型「重生」的關鍵之年,多家數字人廠商收獲新一輪融資、數字人代理江湖進入新一輪擴張,騰訊、百度、京東以及諸多大模型明星企業均将數字人視為大模型落地的前哨站 ......
随手打開社交媒體應用,深夜數字人直播間和短視頻内容并不鮮見,但一年過去,這場數字人熱潮也正在經歷看得見的洗牌和變化。
1、從能用到有用,無法全能的數字人
在數字人服務商阿傑眼中,和去年的狂熱不同,今年前來咨詢的客戶明顯是「有備而來」。有的對比過多家平台的價格,甚至已經踩過不少坑,一上來就會直接比價,問核心系統,有的則是對自身的業務場景和目的十分明确:" 甚至都不會問我要落地用例,直接問 ROI,要結果。"
「只用說 123」是數字人推廣的經典話術 圖源:抖音截圖
比起數字人廠商的宣傳話術,多數企業對數字人的态度正經歷一場祛魅,這種務實态度體現在兩方面:一是數字人的技術成熟并非一蹴而就,廠商們所宣稱的「一句話生成數字人」實則需要經歷具體業務的磨合。二是商家也逐漸意識到,數字人無法全能,目前只是降本的工具。
理解這種态度的變化,2D 數字人直播就是一個觀察視窗。
國内某服裝品牌直播負責人可心告訴「矽基研究室」,他們在 2021 年就接觸到數字人直播,但效果一直不溫不火,原因一方面是流量問題。平台的流量規則不斷在變,企業往往希望公私網域聯動,争取更大的流量規模和更優的流量利用率,但抖音、微信、快手等平台對 AI 數字人直播較為謹慎,數字人很難在公網域流量池直接露出,平台也沒有流量扶持。
抖音明确禁止無人直播 圖源:微博
另一方面則是技術的成熟度不及預期。可心表示,早期數字人的智能性、精準性、拟真性和互動性并不高:" 相對來說是比較像機器人的,類似錄播形式,和消費者的互動還需要進一步提升。"
盡管大模型一定程度上緩解了上述問題,但數字人從能用到真正好用,并非一蹴而就:" 這是一個逐步滿足的過程,而不是一次性滿足。"
首先,從技術層來看,一位大廠技術負責人提到,2D 數字人和大模型結合經歷了「單人模型 - 通用大模型」階段。在單人模型階段,訓練一個單人大模型需要經歷建模、驅動和渲染等環節,但由于服務的是單個具體商家,參數量不大,對數據依賴也沒那麼高,但核心需要提升的是模型的魯棒性和數字人的互動能力,如大姿态、聲唇同步等,這些都需要算法和模型架構的調優和更新。
在通用大模型階段,特别是多模态模型的發展,得益于大模型自身的泛化能力,圖片、視頻和語音數據的多樣性,目前在部分場景下 2D 數字人可實現一體化生成,縮短了制造和生產周期。而年初随着 DeepSeek 拉動低成本推理模型下沉,也加速了數字人能力的迭代,譬如在直播間的智能回復上。
而當這些技術的迭代更新落到商家的具體業務端,數字人廠商和商家場景也有一個磨合的階段。可心提到,盡管從數字人形象、直播間場景設定到最終測試上線,比起此前的數月周期,現在可以不到 3 天就看到 Demo,一個月就用上數字人,但無論是平台形象庫的豐富度,還是數字人的智能回復水平,前後用了一年的時間才達到他們的預期水平。
其次,從實際場景來看,更多的企業也意識到,由于數字人應用還在早期,數字人無法替代人,最多的還是起到引流和降本的作用。譬如在直播場景,目前企業應用數字人一般有三類打法:
• 一是創新直播樣态,創新業務。比如總裁 IP、雙數字人直播等,給頭部品牌的店播增加新玩法,起到創新業務和引流獲客的作用。
• 二是矩陣直播,作為閒時補充。此類數字人直播和真人主播協同,滿足用戶全時段購物需求。
• 三是強運營模式,量大管飽。一些中小企業會和數字人源碼廠商合作,利用矩陣直播和私網域裂變,但這需要非常強的直播操盤能力(包括選品、供應鏈、運營等),還需要熟悉和了解平台規則。
可心提到,目前數字人只是起到協同和降本作用,帶來最直觀的影響是——他們取消了和部分兼職主播的合作,未來是否要大力布局,還需要看技術的成熟度和數字人帶貨的實際效果。
2、為了降低成本和應用門檻,三線并進
企業端對數字人的态度走向務實,頭部數字人廠商甚至更早一點就給市場潑起了「冷水」。
專注在 3D 虛拟數字人領網域的中科深智創始人成維忠在 2023 年就直言:" 有的企業半年沒接到單,很正常。" 矽基智能創始人司馬華鵬也曾提到:" 真人直播做不好,數字人也沒戲。" 他認為,僅在數字人直播領網域,和科技、運營、供應鏈、IP、賬号體系多方面相關。
驅動數字人廠商這種理性态度的根本原因在于——行業正在通過降價、技術開源和產品組合化「三線并進」,大力降低數字人應用的門檻。
在價格上,阿傑告訴「矽基研究室」,從去年開始,數字人行業的價格競争就很激烈,有的号稱賣源碼的甚至都把價格卷到了幾千元," 幾乎是白菜價 "。
微信生态内的數字人源碼廠商 / 服務商 圖源:微信截圖
「矽基研究室」發現,目前市面上數字人的價格有 8000-5 萬一年的產品,也有百萬、千萬級的項目,但相比幾年前數字人的單一采購,目前這種大單數字人廠商一般只屬于「被集成」的一部分。
從定價模式來看,各大廠商大多采用組合定價——包括定制服務、付費訂閱、平台代運營等多種模式,來滿足不同用戶的需求,還有的是直接源碼買斷,但需要辨别技術真偽。
「矽基研究室」從多位數字人源碼廠商推廣人員了解到,源碼獨立部署的報價在幾千到幾萬不等,但「具體可以再談」,一些廠商甚至直接打出了「被封就退款」的賣點,但阿傑提到,源碼廠商目前魚龍混雜,單看價格看不出技術水平:" 你不知道它是自研,還是套殼。"
他記得自己的一個客戶就被源碼廠商的套路坑過,花了幾萬買斷源碼,部署了幾台伺服器,折騰幾個月產品上線後,發現根本用不起來。
降價之外,從去年下半年開始,數字人廠商也在掀起「開源熱」。
比如矽基智能在近期開源數字人模型 heygem.ai,阿裡達摩院推出的 EchoMimic V2,專注在數字人半身動畫視頻生成;騰訊與浙大聯合開源的 Sonic ,京東開源的普通話數字人項目 JoyHallo、字節跳動推出的端到端唇形同步框架 Latentsync 等等,都在加速數字人技術的普及。
而在部分業内人士眼中,數字人更明顯的一層變化還在于從項目制轉向產品制。
上述大廠技術負責人提到,過去數字人訂單主要集中在 G 端,例如政務領網域線下的數字人大屏等,現在随着數字人的普及,各大廠商會細化解決方案,特别是大廠會提供标準化的產品解決方案和豐富的數字人組件商店,提高整體标品的交付能力。
除此以外,售賣數字人一體化的軟硬體設備也成了一些廠商的标配,如 AI 虛拟人直播機、智能互動機等,核心都是為了提升數字人的易用性。
3、多變的競争格局,從合縱連橫到各尋出路
「股神」巴菲特曾告誡投資者:" 要到魚多人少的地方釣魚。"
但在數字人領網域,「魚多人多」已是行業的某種共識,一眼望去,擠滿了焦慮的行業玩家。
數字人賽道的行業玩家目前可以分為三類:大廠派、垂直派和 AI 派。
大廠派,如騰訊智影、百度的曦靈平台、京東的言犀、商湯的如影,華為雲的 MetaStudio 數字人生產平台等,大廠瞄準數字人的意圖不僅在可落地的應用場景,還在于搶奪入口價值。
有從業人士告訴「矽基研究室」,所謂的入口價值一方面在前端,數字人可以接入各類 AI 硬體;另一方面,數字人作為組件可以串聯起大廠的底層雲端算力、大模型 MaaS 服務和 AIGC 產品。
而垂直派如矽基智能、風平智能、小冰、魔琺科技、出門問問、中科深智、配撥精靈等,各自的技術路徑和商業化戰略也不盡相同。
矽基智能、風平智能等數字人企業由于進入數字人領網域較早,產品矩陣和渠道資源是其主要優勢,而聚焦在 3D 數字人領網域的魔琺科技則有較強的高質量 3D 數據沉澱,這些垂直派雖直面大廠的競争,但也表現出了較強的競争力。
還有的則是 AI 派,主要是指一批大模型明星創企,如零一萬物、階躍星辰、智譜 AI 等,等随着商業化加速,數字人也在它們的「射程」之内。
不同行業玩家并非是絕對的競争關系,考慮到算力、場景和生态等因素,多方合縱連橫一直在發生。
比如,在跨境出海上,考慮到出海的算力穩定性,特看科技就和阿裡雲合作;在醫療領網域,矽基智能就和華為雲合作布局了盤古 AI 醫學大屏,醫療作為華為的強勢場景,數字人廠商和雲廠商間的合作布局還會越來越多。
可以确定的是,數字人的競争會在 2025 更加激烈。「矽基研究室」了解到,包括京東在内的大廠會繼續加碼數字人布局,而随着數字人生成的數量和質量繼續提升、價格的下探和玩法的增多,行業必定迎來新的洗牌期。
" 只賣 SaaS,單賣接口的,沒有技術壁壘的,未來生意會越來越難做 "。阿傑已提前感受到了一些「涼意」,他身邊的數字人從業者有的想借做代理,再掙一波快錢,有的也在考慮轉行,因為競争越來越激烈。
天眼查數據顯示,截至 2024 年,中國與數字人相關的企業數量已達 114.4 萬家,僅 2024 年前五個月就新增注冊企業 17.4 萬餘家。
誠然,距離千行百業落地數字人還待時間驗證,但随着數字人告别「印鈔機」年代,行業或迎來新拐點,一場新的洗牌又開始了。