今天小编分享的科技经验:谷歌语音助手将更新,大模型让其变得更聪明,欢迎阅读。
作者 | 虞景霖
编辑 | 邓咏仪
北京时间 8 月 1 日,据 Axios 获得的谷歌内部备忘录显示,谷歌计划将最新的大语言模型(LLM)技术引入 Google Assistant,提高其内容生成能力,该技术类似于 ChatGPT 和谷歌自研的 Bard 聊天机器人。
大模型热潮来临后,巨头们都正在用大模型将自家产品一个个 " 更新 "。比如微软与 OpenAI 建立合作后,将生成式 AI 助手就嵌入到 Edge 浏览器、Microsoft Office 和 Azure 云服务中,让服务变得更加智能
Goggle Assistant 的更新同样体现了这一点。
Google Assistant 是谷歌开发的语音助手,相当于亚马逊的 Alexa 和苹果的 Siri。用户只需说出唤醒词 "OK Google" 或者 "Hey Google",Google Assistant 就会执行用户在这之后发出的语音命令,例如暂停视频、指定任务或者接听电话。
Axio 的备忘录并没有详细说明 Assistant 将要增加哪些具体功能,但大概率将具有和 Bard 类似的 AI 聊天功能—— Bard 是谷歌基于 PaLM 2 之上建立的对话式 AI 模型。
新的 Google Assistant 或将采用 LaMDA 来生成逻辑通畅、文本自然的对话语言,从网络上收集信息后回答用户问题。
而引入大模型之后的 Google Assistant,也会更加 " 聪明 "。以前,Google Assistant、Siri、Alexa 一类的语音助手,常被视作 " 假 AI" ——因为它们只能支持简单的用户互動,例如回答 " 明天天气如何?" 一类的简单问题,或者提供围绕问题搜集到的信息,供用户参考,还经常答非所问。
将 Bard 和 Google Assistant 结合,是一项互补的操作。Bard 能根据从网络上搜索到的信息回答问题,但无法单独执行用户指令,和 Google Assistant 结合后,依附一定的载体,就能实际执行播放音乐或設定闹钟等服务,这将大大增强 Assistant 回答、解决用户问题的能力。
随着 Google Assistant 的更新,谷歌内部团队也将进行重组,部分原 Google Assistant 团队成员将面临解雇。
谷歌对 Google Assistant 的改造早有预兆。2023 年 5 月,谷歌的人工智能团队发布了一份题为 " 利用 LLMs 在移动设备上实现对话式互動 " 的报告,涉及移动用户界面的大语言模型应用测试。
报告提到,将大预言模型和 GUI(Graphical User Interface,即图形用户界面,用图形方式显示的计算机操作用户界面)进行整合,包括了总结螢幕内容、根据显示的内容回答问题、将指令映射到用户操作界面等四大功能。
其中,最受关注的一个功能是 " 将指令映射到用户操作界面 " ——本质上,这相当于是利用指令(语音或文本)控制来用户的终端设备。例如,通过指令打开手机应用程式、调整手机蜂窝网络模式等。
如今,谷歌也正是计划从移动端着手推进强化 Assistant 计划。安卓端的 Google Assistant 已经具备了由 AI 驱动的功能,能够帮助用户总结网页内容。
移动端的改造只是开始,可以预见,Google Assistant 更新后,起调整影响范围比想象中的要广得多,因为 Google Assistant 已经作为 AI 助手嵌入到了 Google 各类产品之中——比如智能音箱和智能显示器。
" 每月有数亿人使用 Assistant,我们致力于为他们提供高质量的体验," 谷歌发言人 Jennifer Rodstrom 在给 The Verge 的一份声明中表示," 我们很高兴能探索大语言模型如何帮助我们强化 Assistant,让它变得更好。"