今天小编分享的科学经验:第一个能听懂人类语气的AI火了,网友:感觉在和真人交谈,欢迎阅读。
第一个能听懂你说话的语气、有 " 情商 " 的 AI 火了!
请看 VCR:
△字幕为机器翻译
这个 AI 名为EVI(Empathic Voice Interface),它不仅能够能够理解用户的语气,还会为每个词增加意义。
对话中的每句话,它都能可视化含惊讶量、含悲伤量、含兴奋量……
然后根据用户的声音信号来变换自己的语音语调,给出高情商回答。
EVI 发布后,网友再次沸腾,称其为 " 语音互動的游戏规则改变者 "。
知名科技博主,曾是微软最著名博客人的 Robert Scoble 也下场体验了,让 EVI 讲起了笑话:
△字幕为机器翻译
网友看了 EVI 的一系列效果后也坐不住了:
除了 ChatGPT,第二个让我深感震惊的 demo 就是这。
还有网友表示自己用 ChatGPT 语音对话时,就预想到了这样的功能体验,现在想法变成了现实。
确实,ChatGPT、讯飞星火等语音对话都是直接将对话内容转换成文字,语气停顿都不能保留。
知心大姐 / 哥 EVI 来了
目前,官方放出了 demo,大伙儿可以试玩。
不过由于太火,有时也会出现被挤爆情况。
已经玩上的网友开始询问它各种问题。
比如讨论冬天天气严寒,是否要给楼房建造项目增加隔热材料。
△字幕为机器翻译
有网友用不同语调来测试它,EVI 都能识别并变换多种情绪回应。
△字幕为机器翻译
还有网友开始整花活,让两个 EVI 对话,不断让它们互相打断对话,然后两个 EVI 都开始 " 请,继续 "、" 我洗耳恭听 "。
再来看官方的介绍,总的来说,EVI 是一个基于自研的具有同理心的大模型 "eLLM" 驱动的 API,4 月份将正式发布。
有这么几个特点:
根据你的情绪以类似人类的语调作出回应
针对你的需求,使用能够提高满意度的语言反应
知道何时讲话,利用你的语调精准判断对话轮次结束
若被打断会停止发言,并能从中断点恢复对话
通过分析你的反馈逐渐自我优化,增强你的幸福感
通过申请,开发者可以提前获得开发访问权限,将 EVI 集成到各种应用中。此外,EVI 还可以融合外部大模型 API 的回应,而 demo 融入了 Claude 3 Haiku。
不少开发者已经在评论区开要权限:
背后公司 Hume AI
打造出 EVI 的,是一家名为Hume AI的实验室 / 科技公司。目前团队共有 30 人,已在顶刊发表了超 8 篇学术文章。
CEO 兼首席科学家 Alan Cowen 是前谷歌研究员。
他的主要研究是利用计算方法来探讨情感行为如何被激发、概念化、参数化、预测、注释和转化。
据了解,他提出的语义空间理论(semantic space theory),是 Hume AI 用来捕捉和理解人类表达和沟通中复杂微妙细节的数据驱动方法的基础。
此外,Hume AI 还有加州大学伯克利分校心理学教授 Dacher Keltner 助阵,COO 是前 Ageis Ventures 合伙人 Janet Ho。
就在几天前,Hume AI 完成了 5000 万美元的新一轮融资。
之前,Hume AI 还推出了 Expression Measurement API,一个用于测量人类情感表达的高级工具包,以及 Custom Models,它使用这些测量的迁移学习来预测人类的偏好。
那么对于新发布的 EVI,你觉得它的效果如何?
参考链接:
[ 1 ] https://x.com/hume_ai/status/1773017055974789176?s=20
[ 2 ] https://x.com/hume_ai/status/1773418096499257528?s=20
[ 3 ] https://x.com/AviSchiffmann/status/1773070097210335336?s=20
[ 4 ] https://x.com/catherineols/status/1773222122430550336?s=20
[ 5 ] https://x.com/mohakmangal/status/1773187272881357192?s=20
— 完 —
【 火热报名中】中国 AIGC 产业峰会
定档 4 月 17 日
峰会已经邀请到数位代表技术、产品、投资、用户等领網域嘉宾,共论生成式 AI 产业最新变革趋势。
最新确认嘉宾包括:商汤科技杨帆、轻松集团高玉石、印象笔记唐毅、蚂蚁集团李建国等,。
峰会将全程线上下同步直播,欢迎预约直播 ⬇️
点这里关注我,记得标星噢
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>