今天小编分享的教育经验:精准学将公布中国首个语音端到端大模型,欢迎阅读。
教育科技公司精准学宣布,公司已在 AI 语音互動技术上取得领先性的突破,成功训练了中国首个语音端到端大模型 " 心流知镜 -s ( V02 ) ",可直接实现语音输入 - 语音输出的互動,使其更适配辅学场景,使大模型达到 " 真人老师 " 级别的自然对话交流体验。
" 心流知镜 -s ( V02 ) " 使用端到端语音结构,避免了级联 ASR+LLM+TTS 方式额外延迟,同时也更好的改善纯文本模型损失的情感节奏等丰富信息,接近人类的语音互動体验。
精准学也提供时间表开放基础模型供学术和非商用使用,致力于为中文 AI 社区的科研和技术探索作出贡献。
" 心流知镜 -s ( V02 ) " 的发布,不仅将在高质量中文语音 Codec 和中文自监督预训练 Encoder 基础设施上填补中文开源社区的空白,还将在全球范围内成为首个开放给技术社区的语音端到端大模型。
精准学将于近期对外展示这项技术的应用成果。5 月,公司获得了阿里 2 亿元投资,目前其 AI 辅学机 Bong 系列已在天猫京东上线。不久后用户也可以在精准学 AI 辅学机上体验到这项技术突破成果。