大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

字节豆包首个AI硬體来了,定价1199元!

2024-10-12 简体 HK SG TW

今天小编分享的科学经验:字节豆包首个AI硬體来了,定价1199元!,欢迎阅读。

字节跳动的首个 AI 硬體,就这么水灵灵地来了——

一款塞了大模型的蓝牙耳机!

 

这个 AI 耳机,名叫 Ola Friend,"Ol á " 在葡萄牙语中意为 " 你好 ",因此它的中文名就是:你好呀 朋友。

首先,Ola Friend 最大的亮点,就是第一个做到了真正把通用大模型应用到耳机场景——

戴上耳机,只需一句 " 豆包豆包 ",就可以随时随地唤醒 AI,并跟它做任何交流。

例如出门前询问天气、路面状况,现在的 " 打开方式 " 是这样的:

 

视频详情:https://mp.toutiao.com/profile_v4/graphic/articles

当然,这些问题都只能算是开胃菜,我们直接来上一下难度——英语口语练习!

 

视频详情:https://mp.toutiao.com/profile_v4/graphic/articles

不难看出,现在跟 AI 练习英语口语,就变成戴个耳机就能实现的事情了,而且你可以随时打断豆包说话(1 分 29 秒左右)。

 

当然,作为一个蓝牙耳机,其本身最基本的 " 听 " 的功能也是非常重要的。

Ola Friend 在设计上属于不入耳的开放式(OWS)耳机,单只的重量只有 6.6 克(亲测佩戴无重感)。

在音效方面,由于设计采用 27.5 度夹角,发声单元会更靠近耳道,声压比会相对大一些;并且还采用了 10mm 动圈发声单元、动态 EQ1.0、动态低音补偿、定向防漏音等设计,提升了耳机的音质。

上面视频中豆包说话的音效,其实就已经非常接近佩戴时候的真实感觉了。

但毕竟我们第一时间拿到了 Ola Friend,定然不能就这么简单放过它——

实测嘛,就是要狠狠地、各方面地都来体验一把。

  嘈杂环境、方言,统统都能 hold 住

首先我们需要介绍一些基本的功能和設定。

Ola Friend 在和手机配对的时候,需要双手同时按住两侧机身,然后就可以在手机蓝牙中找到它并连接。

但要想开启 AI 大模型功能,还需要进豆包 APP 的 " 我的→設定 " 里,找到 "Ola Friend 耳机 " 选项,进行第二次配对;其中," 豆包智能体 " 选项中的唤醒功能是默认开启的。

 

接下来,我们就再贴近真实生活场景来一波测试。

毕竟我们戴耳机不仅仅是在安静的环境,大多数可能都是非常嘈杂的环境,那么在用 Ola Friend 跟豆包对话的过程中,它会不会受到外界环境的影响呢?

我们这波测试的环境設定如下:电腦外放音乐,用中英掺杂的方式跟豆包对话。

(由于对话文字内容较长,以下几个实测视频将以字幕的形式呈现)

 

视频详情:https://mp.toutiao.com/profile_v4/graphic/articles

即便背景放了巨大音量的英文歌,但豆包还是能够精准识别出用户的声音,在问及 " 为什么今年的 the Nobel Prize in Physics 颁给了 Geoffrey Hinton" 时,豆包也能做出准确回答。

由此可见,在嘈杂的现实环境中,Ola Friend 也是完全可以 hold 住的。

而之所以能够如此,是因为 Ola Friend 是可以像朋友一样专门记住你的声音,这就大幅降低了错误打断的概率。

同样的问题,同样的环境,我们再有请方言出战——四川话!

 

视频详情:https://mp.toutiao.com/profile_v4/graphic/articles

这一次,我们特意切换了语音风格为 " 呆萌川妹 ",是不是相当地有那味儿了!

那么对于复杂的数学题,Ola Friend 又将做何表现?

我们不妨以电影《抓娃娃》片段中的那道经典题目来提问(这次我们切换了声音为 " 温暖阿虎 "):

  一个长 2 米,直径 30cm 的圆柱形木材,做半径 6cm 比做半径 8cm 能多做多少个球?

 

视频详情:https://mp.toutiao.com/profile_v4/graphic/articles

从求解过程中不难看出,不论是要求 Ola Friend 直接给出答案,亦或是在它求解过程中任意打断(1 分 17 秒、1 分 59 秒、2 分 14 秒),它都能像跟真人交流一样严丝合缝。

不难看出,戴上了 Ola Friend,就宛如实时地在跟 AI 大模型电话一样,而且是有问必答、随意打断、多轮对话的那种。

因此,像在做饭烧菜等场景中,这个 AI 大模型耳机就能在释放双手的同时,还能做到答疑解惑。

方便,着实是方便。

那么接下来的一个问题便是:Ola Friend 是如何做到的?

  大模型 +TTS+ASR 炼成

扒开 Ola Friend 内核,关键之一是字节于业界领先的大规模自回归文本到语音模型—— Seed-TTS。

几个月前,字节发布了 Seed-TTS 技术论文,引发圈内广泛关注。

它可以依据上下文理解文本情绪,能生成与人类语音几乎无法区分的高质量语音,说话自然有感情,连停顿、喘息、换气声都合成得真真儿的。

 

视频详情:https://mp.toutiao.com/profile_v4/graphic/articles

从技术实现上来看,Seed-TTS 基于自回归 Transformer,模型架构包含 speech tokenizer 从语音中提取 token 信息,语言模型建模文本和语音 token 的关系,扩散模型从语音 token 生成连续的语音表征,最后通过声码器生成最终的语音。

训练含三个阶段:

预训练:使用大量数据训练,实现广泛的应用场景和说话者覆盖。

微调:说话者微调,以提高特定说话者或任务的性能。

后训练:使用强化学习进行后训练,全面提高模型性能。

与以前的模型相比,Seed-TTS 在自然性和稳定性方面有显著提升。

经实验,Seed-TTS 不仅具有零样本上下文学习能力,基于短音频提示生成相似声音的新语音,还可以针对特定说话人进行微调,进一步提高相似度。

在情感等方面 Seed-TTS 具有更高的可控性,且支持跨语言语音合成,拿捏讲话的音调、韵律、节奏。

Ola Friend 另一大法宝是语音识别技术—— Seed-ASR。

与 AI 智能音箱和车载语音系统相比,耳机通常在公共空间中被使用。这些场所环境嘈杂并且人多,因此在这些环境中进行声音识别和意图判断面临较大挑战。

而字节 Seed-ASR 技术,不仅让 Ola Friend 能听懂用户说话,甚至能通过上下文识别各类信息。

Seed-ASR 以大语言模型为基础,通过输入连续的语音表示和上下文信息,显著提升了在不同应用场景下对多样语音信号的识别准确率。

它支持包括普通话及多种方言在内的多语言识别,在丰富的训练数据上进行大规模的自监督学习,还通过了阶段性训练策略,包括监督式微调、上下文感知训练和强化学习,进一步优化性能。

Seed-ASR 在公开测试集和内部综合评估集上均展现出比现有端到端模型更低的词 / 字错误率。

 

除此之外,依靠豆包大模型,Ola Friend 还有 buff 加成——

能够双向实时对话,随时打断也可以,支持引入其他话题多轮交流,而非每句话都要唤醒词并且听完全部再回复。

与传统智能音箱助手等大多是特定任务可以多轮(如追问天气情况)不同,接入大模型之后,在交流中随意切换话题也不怕,可以做到通用场景全双工连续对话。

另外,Ola Friend 进行了很多工程优化,像是链路预加载等,使得端到端互動时间可以缩短,降低用户讲话后得到反馈的时间。

  开放式耳机的 AI 进化

作为字节跳动豆包团队第一款 AI 硬體,几天前官方刚发布预热海报,就有大批网友开始猜测 Ola Friend 是耳机呢?还是眼镜呢?还是耳机呢?

这下它的神秘面纱终于被揭开,那为啥字节能将 AI 互動引入到耳机场景呢?

不仅得益于自家的豆包大模型支持,还与其硬體团队的实力密不可分。

据了解,九月份,字节跳动正式宣布成功收购开放穿戴式音频产品厂商 Oladance,完成 100% 控股。

Ola Friend 硬體团队就是原 Oladance 耳机团队,也就是最早做 OWS 开放式耳机的那帮人,有深厚技术积累。

团队出身如此,所以 Ola Friend 也正如我们前文所提到的,不仅从设计上不单单考虑了 AI 硬體的性能,还兼顾了传统开放式耳机的舒适度和音质。

同时团队还专门推出了优化降噪算法,算法已申请专利,针对轻声唤醒和互動专门做了改进,用户用较轻的声音就能唤起豆包。

也就是说,在公开场合中悄默声就能唤醒,妈妈再也不用担心我会社死。

 

大模型技术的发展正如日中天,各种 AI 硬體如雨后春笋般涌现,从智能家居到个人助手,AI 正在深刻改变我们的生活方式。

在这一背景下,字节跳动推出的 Ola Friend 无疑为 AI 硬體耳机市场带来了新的活力。

据悉,Ola Friend 将于 10 月 17 日起售,听说后续 AI 功能还会持续更新,未来 Ola Friend 不仅能唤醒豆包,还可以唤起更多智能体。

那么你对这个首款 AI 大模型耳机心动了吗?​​​​

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們