谷歌语音助手将更新，大模型让其变得更聪明

今天小编分享的互联网经验：谷歌语音助手将更新，大模型让其变得更聪明，欢迎阅读。

作者 | 虞景霖

编辑 | 邓咏仪

北京时间 8 月 1 日，据 Axios 获得的谷歌内部备忘录显示，谷歌计划将最新的大语言模型（LLM）技术引入 Google Assistant，提高其内容生成能力，该技术类似于 ChatGPT 和谷歌自研的 Bard 聊天机器人。

大模型热潮来临后，巨头们都正在用大模型将自家产品一个个 " 更新 "。比如微软与 OpenAI 建立合作后，将生成式 AI 助手就嵌入到 Edge 浏览器、Microsoft Office 和 Azure 云服务中，让服务变得更加智能

Goggle Assistant 的更新同样体现了这一点。

Google Assistant 是谷歌开发的语音助手，相当于亚马逊的 Alexa 和苹果的 Siri。用户只需说出唤醒词 "OK Google" 或者 "Hey Google"，Google Assistant 就会执行用户在这之后发出的语音命令，例如暂停视频、指定任务或者接听电话。

Axio 的备忘录并没有详细说明 Assistant 将要增加哪些具体功能，但大概率将具有和 Bard 类似的 AI 聊天功能—— Bard 是谷歌基于 PaLM 2 之上建立的对话式 AI 模型。

新的 Google Assistant 或将采用 LaMDA 来生成逻辑通畅、文本自然的对话语言，从网络上收集信息后回答用户问题。

而引入大模型之后的 Google Assistant，也会更加 " 聪明 "。以前，Google Assistant、Siri、Alexa 一类的语音助手，常被视作 " 假 AI" ——因为它们只能支持简单的用户互動，例如回答 " 明天天气如何？" 一类的简单问题，或者提供围绕问题搜集到的信息，供用户参考，还经常答非所问。

将 Bard 和 Google Assistant 结合，是一项互补的操作。Bard 能根据从网络上搜索到的信息回答问题，但无法单独执行用户指令，和 Google Assistant 结合后，依附一定的载体，就能实际执行播放音乐或設定闹钟等服务，这将大大增强 Assistant 回答、解决用户问题的能力。

随着 Google Assistant 的更新，谷歌内部团队也将进行重组，部分原 Google Assistant 团队成员将面临解雇。

谷歌对 Google Assistant 的改造早有预兆。2023 年 5 月，谷歌的人工智能团队发布了一份题为 " 利用 LLMs 在移动设备上实现对话式互動 " 的报告，涉及移动用户界面的大语言模型应用测试。

报告提到，将大预言模型和 GUI（Graphical User Interface，即图形用户界面，用图形方式显示的计算机操作用户界面）进行整合，包括了总结螢幕内容、根据显示的内容回答问题、将指令映射到用户操作界面等四大功能。

其中，最受关注的一个功能是 " 将指令映射到用户操作界面 " ——本质上，这相当于是利用指令（语音或文本）控制来用户的终端设备。例如，通过指令打开手机应用程式、调整手机蜂窝网络模式等。

如今，谷歌也正是计划从移动端着手推进强化 Assistant 计划。安卓端的 Google Assistant 已经具备了由 AI 驱动的功能，能够帮助用户总结网页内容。

移动端的改造只是开始，可以预见，Google Assistant 更新后，起调整影响范围比想象中的要广得多，因为 Google Assistant 已经作为 AI 助手嵌入到了 Google 各类产品之中——比如智能音箱和智能显示器。

" 每月有数亿人使用 Assistant，我们致力于为他们提供高质量的体验，" 谷歌发言人 Jennifer Rodstrom 在给 The Verge 的一份声明中表示，" 我们很高兴能探索大语言模型如何帮助我们强化 Assistant，让它变得更好。"