今天小編分享的科技經驗:告别一眼假,這下數字人終于「會思考」和「能協同」,歡迎閲讀。
哲學家安迪 · 克拉克在《自然天生的賽博格》中提出,人類與技術的關系正從「使用工具」轉變為「共生演化」。
數字人技術正在加速這個進程:在你不在場的情況下,由你的形象、聲音創造的數字人,可以進行 24 小時不間斷的交流和表達,這個時候,「人」的存在形式已被重新定義。
這些主播們的聲音熱情,講起貨品來流暢清晰。仔細琢磨這些完美的面孔,和多變的表情語調,很可能看完了一整個直播都很難意識到—— 這些并非真人,而是由 AI 驅動的數字人主播。
數據顯示,虛拟數字人已占據數字人應用市場 22.7%,在電商直播帶貨領網域位居首位,其互動性和拟真度不斷提升。
今天,百度在 Create2025 百度 AI 開發者大會上,也發布了新一代的慧播星數字人。百度創始人李彥宏也首次提出高説服力數字人的概念。
數字人主播,終于不再是曾經的「僵硬木偶」,而是開啓了全新的版本,走向如李彥宏所説的「人人都是一支營銷隊伍。」
AI 主播終于學會了「演」
「媲美真人」聽上去,不過是所有數字人都在做的事——但真正看過案例,才能感受到當中的「説服力」。
高拟真不令人驚訝,真正令人驚訝的是這麼多動作、表情,以及随時需要對各種問題做出回復,數字人都能流暢無礙完成——護膚品説擦就擦,演示伸手就來。
這一系列的動作背後都有設計,這一次慧播星從腳本模式更新成為劇本模式,詳細的劇本不僅能指導角色講什麼,還設計了場景、情感、語調、動作等等。以此來驅動數字人的語氣、表情、動作,高度的融合和統一 ,數字人因此可以順暢流利的結合内容,配合做出動作。
換句話説,現在的數字人不再只是復刻真人主播的形象和聲音,并且要能做到情緒轉換與動作銜接,如真人般自然流暢,從而實現行業斷層領先。
這種能力是「高説服力」數字人的關鍵。直播中應用到數字人,本身并不稀奇,這也是 AI 實際落地裏一個常見的應用方向,各大電商平台,早就已經有了數字主播的出現。只是那個時候,光是讓數字人看上去「不塑料」「不出戲」,就已經竭盡全力了。
而如今,在應用越來越普遍的情況下,數字人也越來越「卷」。基于多模态技術為用户打造數字人,通常需要融合文本、語氣、視覺、動作甚至情緒感知等多種模态,技術鏈路復雜。涉及跨模态融合與協同、自然語言理解和生成、動作捕捉與生成,以及實時互動與延遲優化。
基于文心 4.5 turbo ,慧播星數字人已經擺脱了過去那種「一眼假」的尴尬。拟真度的改變和提升只是一部分—— 真正有決定性的,是其自主思考決策能力,以及多智能體調度能力。
這些能力真正決定了商户的使用體驗,并且最檢驗背後的技術實力。
當你打開一個慧播星支持的直播間,你會看到主播自然地轉頭、拿起商品、360 度展示細節,甚至手勢和表情都精準到位。這種超拟真效果足以讓你懷疑:「這真的是 AI?」
這是百度對于「高説服力」的定義:在用户體驗上和直播場景上,數字人已經可以達到表現力媲美真人,甚至在一些場景下的轉化率,能夠超越真人。
一部手機把你變成「主播工廠」
數字人主播的興起,源自于電商直播行業對高效、低成本運營模式的需求。傳統真人主播面臨高昂的人力成本和有限的工作時間,而數字人主播則可以實現 24 小時不間斷直播,極大地提高了運營效率,實現降本增效。
這裏所説的「降本」,除了指可以省去主播、助播的人工成本,也包括搭建、測試等一系列學習成本。
換句話説,平台和科技公司在打磨多模态技術上出力,到了用户這頭,也需要花力氣學習、研究各種操作和使用。當流程過于繁瑣的時候,就相當勸退。
這一次百度最新發布的手機端,搭載了可能會是直播行業最實用的創新之一: 「一鍵開播」功能。
只需手機号注冊,上傳 2 分鍾視頻,任何人都能在手機上一鍵啓動自己的數字人直播。
不過,這只是起點。有了主播形象的聲音之後,還有直播間的環境搭建,尤其是要針對不同類型產品,配備不同的腳本、素材……這些都是「門檻」。
「一鍵開播」是真的一鍵,通過百度 app,找到慧播星之後,直接就能看到預設好的四種腳本類型。當然,也完全可以自己寫,這些預設腳本就是最好的參考。
想象一下,一位珠寶帶貨主,同時在 10 個直播間用不同風格介紹同一款產品——用科學風格講解寶石知識,用文學風格講述珠寶品牌背後的故事,用帶貨風格直擊用户痛點,直接上價格優惠。
依據主播人設定制腳本、強化主播風格,是慧播星的強項所在,囊括了文心 4.0、文心 4.5、DS-R1 多個模型在内。 通過深入淺出的講解,提升内容的科普性,拉長用户停留時長及直播間轉化,甚至能夠做到實時追蹤網絡熱點,将當下熱梗融入商品講解。
平心而論,主播雖然随處可見,可每一個主播的表現力是不一樣的,這受限于他的知識水平、語言表達水平。而數字人不再受到這些條件的約束,它的知識儲備可以是無限的,表達能力也可以随具體情況靈活變化。
一個「反常識」的情況是: 一些健康保健品的商家,更傾向于使用數字人 。百度副總裁、百度電商總經理平曉黎提到,因為真人主播可能出現口誤,而出現違禁詞。而數字人在做好優化的前提下,可以實現精準的控制。一些垂類内容,可以通過引入知識庫來解決。
配置相應的環境,生成腳本,還能根據貨品與場景靈活調整演播方式,這些都在真正有效降低直播的門檻。無論是知識科普、生活分享,還是情感咨詢,都可以完美适配, 每一個用户,都能實現從 「視頻」 到 「主播分身」的華麗轉身。這才是技術革新帶來的最直接、明确的價值與意義。
直播,多模态 AI 落地的最佳場景
IDC 最新報告顯示,百度慧播星在電商直播數字人領網域綜合實力排名第一。這不是偶然——直播電商恰恰是多模态 AI 技術的理想落地場景。在這裏,視覺、聽覺和互動體驗完美融合,AI 技術的多重優勢得以充分發揮。
對競争已經相當激烈的直播行業來説,數字人技術帶來了三大改變:
1. 規模化突破
過去一年,慧播星數字人主播已超過 10 萬,助力商家平均轉化率提升 31%,開播成本降低 80%。如果是在百度站内,平台給予的扶持,可以做到幾乎沒有什麼成本就能開播。
2. 人機協作的新模式
數字人并非簡單替代真人主播,卻可以拆解原有的主播工作,實現原有流程的整合。傳統直播裏,運營跟主播需要配合,還需要搭配助播、場控等等,而數字人相當于把這些角色都拟合在了一起,對小微型商家,簡直不能更友好。
3. 走向素人
不是每一個人都擅長對着鏡頭,滔滔不絕講上三四個小時。但是數字人的技術,幫助了更多的素人獲得 AI 帶去的普惠。甚至不再局限于「視頻創作者」,而是擁有自己的「主播分身」,普通人也能實現自己的 24 小時不間斷,從而經營起自己的直播。
在多模态 AI 技術的眾多應用場景中,直播或許是最能體現技術商業價值的領網域。畢竟,沒有其他場景能同時對視覺拟真度、語音自然度、實時互動和内容創作提出如此高的要求。
這也反映了百度慧播星最大的亮點在于, 它不只解決了「看起來像人」的問題,更是讓數字人擁有了「會思考」和「能協同」的能力。這意味着 AI 不只是模仿人類,而是成為直播場景中能獨立應對各種情況的智能主體。
接下來,直播的用户即将面對一場颠覆性的互動革命。具備高説服力的數字人,根據直播間氛圍自動應答、調整視頻素材,甚至模拟真人的暖場互動,這種智能化體驗正在重塑消費者對直播的期待。
對于從業者而言, AI 輔助讓專業人士得以專注于核心價值創造。而對于還在觀望的素人,當技術不再局限于少數頭部主播,而是成為每個人都能掌握的工具,百度正在推動的,是一場關于内容創作與商業表達的民主化革命。