今天小编分享的互联网经验:当大模型为虚拟数字人插上翅膀,内嵌AI终端终于盘活了,欢迎阅读。
图片来源:视觉中国
生成式 AI 的蓬勃发展重新激活了元宇宙原住民—— AI 数字人的魅力。
曾经内嵌 AI 数字人的终端设备遭遇很多诟病,比如答非所问、不能进行多种语言切换、不能对于相近意思展开联想等等,所以很长时间来,它徒有一副好看的 " 皮囊 "。
于是在设备开发上索性选择扬长避短,重 " 端侧 " 而轻 " 云端 ",即更加注重硬體的美观度,互動却成了次要的事情。
如今,大模型的出现,终于可以为 AI 数字人注入有趣而深邃的 " 灵魂 ",开启了自然语言和机器互動的新局面。
AI 终端体验全面刷新
随着以大模型为主的生成式 AI 技术通过智能涌现能力进行加持,AI 终端的体验将变得更加人性化,体现在不仅对于自然语言的理解有显著提升,还能够通过对于语音语调的分析,敏感捕捉用户的意图甚至情感需求。
但是," 有形 " 的感受背后是技术上 " 无形 " 的突破。百融云创(百融云 -W,6608.HK)相关人士表示,AI 大模型和数字人原本是两条不同的技术路线,将二者进行融合的关键技术突破点是 TTS 技术(文本转语音)。
在百融云创看来,除了要保证质量的精确度,用户与 AI 数字人的交流还需要有流畅互動体验,要做到对话不卡顿、无限制,唯有这样的终端设备才能与用户建立黏性。
而为了达到这一目标,百融云创将内置 TTS、ASR(自动语音识别)、软交换(FreeSWITCH)、NLP(自然语言处理)等技术的 Voice GPT 进行反复迭代,目前该对话大模型基本能够达到真人级互動体验,实现低于 500 毫秒级的响应速度。
据悉,Voice GPT 是百融云创产业大模型簇 BR-LLMs 数智矩阵中的核心产品之一。此前该对话大模型在银行、消金、保险、电商等垂直领網域得到广泛应用,每日能进行超过亿级规模的自动互動,频次领先业内,并且对于多种语言和方言都能自如识别和切换。此外,它还具有强大的自学习能力,可以根据用户的反馈和行为不断优化其性能和准确度。
可以说,插上了大模型翅膀的 AI 数字人有了指数级的进步。分析预计,在百行千业降本增效的强需求之下,后续 AI 数字人的市场规模将持续增长。
根据 iiMedia Research(艾媒咨询)报告,2022 年中国虚拟人核心市场规模为 120.8 亿元,同比增长 94.2%,该机构预期及至 2025 年,这一市场规模将增至 480.6 亿元。
轻量化、场景化部署或成趋势
伴随着技术的长足进步,AI 数字产品和服务作为天然链接软硬體的入口级产品,正以更快的速度融入 B 端,其应用场景更加多元化,在金融、物流、能源和建筑等垂直行业加速落地,扮演主播、代言人、客服和智能助理等角色。
并且在模型压缩、微调、优化等技术的赋能之下,内嵌 AI 大模型的终端发展趋势将更趋轻量化、专属场景化。
例如,百融云创以大模型 BR-LLM 为基座开发的应用平台 Cybertron,通过与企业内部的数字化系统或者领網域知识库相对接,能够做到与目标场景紧密融合,产生与企业业务相配合地专属化服务。
Cybertron 平台通过 AI 员工、客服数字人等各类 Agent 应用的形式能够轻松集成到企业的 IT 架构之中,从而让大模型变成企业内部的私有智能工具,企业不需要了解数字人的后台操作即可通过快速更换或更新系统而完成个性化定制。
" 由于模型工具调用能力的进步,将 Cybertron 平台应用在企业级数字人服务方面,可以在一定程度上缩短企业的产业链,提升机构内部的运转效率。" 百融云创相关人士表示,集成了决策式 AI 和生成式 AI 双重技术的 Cybertron 平台能够更加高效地处理和分析客户意图、市场趋势等,加强对复杂场景的理解和预测能力。
以 AI 数字人代理运营模式为例,企业只需要将基本的品牌信息、产品特色等输入给数字人,即可由后者代理品牌营销工作,数字人利用自然语言处理和机器学习技术精准分析消费者行为模式和隐含需求,提供个性化建议。同时,数字人还可以在实时的数据分析基础上,创建并发布品牌运营策划,便利商业机构提高营销效率。
也许在不久的将来,当我们身处异国的机场、商场、酒店等陌生场所,遇到日常难题需要咨询时,人类不再是我们的第一求助对象,没有语言障碍的 AI 数字人才是我们更好的选择,这便是科技向人类社会投下的文明之光。