今天小編分享的互聯網經驗:當大模型為虛拟數字人插上翅膀,内嵌AI終端終于盤活了,歡迎閱讀。
圖片來源:視覺中國
生成式 AI 的蓬勃發展重新激活了元宇宙原住民—— AI 數字人的魅力。
曾經内嵌 AI 數字人的終端設備遭遇很多诟病,比如答非所問、不能進行多種語言切換、不能對于相近意思展開聯想等等,所以很長時間來,它徒有一副好看的 " 皮囊 "。
于是在設備開發上索性選擇揚長避短,重 " 端側 " 而輕 " 雲端 ",即更加注重硬體的美觀度,互動卻成了次要的事情。
如今,大模型的出現,終于可以為 AI 數字人注入有趣而深邃的 " 靈魂 ",開啟了自然語言和機器互動的新局面。
AI 終端體驗全面刷新
随着以大模型為主的生成式 AI 技術通過智能湧現能力進行加持,AI 終端的體驗将變得更加人性化,體現在不僅對于自然語言的理解有顯著提升,還能夠通過對于語音語調的分析,敏感捕捉用戶的意圖甚至情感需求。
但是," 有形 " 的感受背後是技術上 " 無形 " 的突破。百融雲創(百融雲 -W,6608.HK)相關人士表示,AI 大模型和數字人原本是兩條不同的技術路線,将二者進行融合的關鍵技術突破點是 TTS 技術(文本轉語音)。
在百融雲創看來,除了要保證質量的精确度,用戶與 AI 數字人的交流還需要有流暢互動體驗,要做到對話不卡頓、無限制,唯有這樣的終端設備才能與用戶建立黏性。
而為了達到這一目标,百融雲創将内置 TTS、ASR(自動語音識别)、軟交換(FreeSWITCH)、NLP(自然語言處理)等技術的 Voice GPT 進行反復迭代,目前該對話大模型基本能夠達到真人級互動體驗,實現低于 500 毫秒級的響應速度。
據悉,Voice GPT 是百融雲創產業大模型簇 BR-LLMs 數智矩陣中的核心產品之一。此前該對話大模型在銀行、消金、保險、電商等垂直領網域得到廣泛應用,每日能進行超過億級規模的自動互動,頻次領先業内,并且對于多種語言和方言都能自如識别和切換。此外,它還具有強大的自學習能力,可以根據用戶的反饋和行為不斷優化其性能和準确度。
可以說,插上了大模型翅膀的 AI 數字人有了指數級的進步。分析預計,在百行千業降本增效的強需求之下,後續 AI 數字人的市場規模将持續增長。
根據 iiMedia Research(艾媒咨詢)報告,2022 年中國虛拟人核心市場規模為 120.8 億元,同比增長 94.2%,該機構預期及至 2025 年,這一市場規模将增至 480.6 億元。
輕量化、場景化部署或成趨勢
伴随着技術的長足進步,AI 數字產品和服務作為天然鏈接軟硬體的入口級產品,正以更快的速度融入 B 端,其應用場景更加多元化,在金融、物流、能源和建築等垂直行業加速落地,扮演主播、代言人、客服和智能助理等角色。
并且在模型壓縮、微調、優化等技術的賦能之下,内嵌 AI 大模型的終端發展趨勢将更趨輕量化、專屬場景化。
例如,百融雲創以大模型 BR-LLM 為基座開發的應用平台 Cybertron,通過與企業内部的數字化系統或者領網域知識庫相對接,能夠做到與目标場景緊密融合,產生與企業業務相配合地專屬化服務。
Cybertron 平台通過 AI 員工、客服數字人等各類 Agent 應用的形式能夠輕松集成到企業的 IT 架構之中,從而讓大模型變成企業内部的私有智能工具,企業不需要了解數字人的後台操作即可通過快速更換或更新系統而完成個性化定制。
" 由于模型工具調用能力的進步,将 Cybertron 平台應用在企業級數字人服務方面,可以在一定程度上縮短企業的產業鏈,提升機構内部的運轉效率。" 百融雲創相關人士表示,集成了決策式 AI 和生成式 AI 雙重技術的 Cybertron 平台能夠更加高效地處理和分析客戶意圖、市場趨勢等,加強對復雜場景的理解和預測能力。
以 AI 數字人代理運營模式為例,企業只需要将基本的品牌信息、產品特色等輸入給數字人,即可由後者代理品牌營銷工作,數字人利用自然語言處理和機器學習技術精準分析消費者行為模式和隐含需求,提供個性化建議。同時,數字人還可以在實時的數據分析基礎上,創建并發布品牌運營策劃,便利商業機構提高營銷效率。
也許在不久的将來,當我們身處異國的機場、商場、酒店等陌生場所,遇到日常難題需要咨詢時,人類不再是我們的第一求助對象,沒有語言障礙的 AI 數字人才是我們更好的選擇,這便是科技向人類社會投下的文明之光。