今天小编分享的互联网经验:Meta发力AI Agent,Llama 4将实现直接语音对话,欢迎阅读。
Meta 正发力 AI Agent,尤其是在端侧 AI 和语音互動方面。公司计划将在未来几周内推出的 Llama 4 中引入更强大的语音功能。
据英国《金融时报》报 7 日报道,Meta 首席产品官 Chris Cox 在摩根士丹利技术、媒体和电信会议上透露,Llama 4 将是一个 " 全能模型 ",语音功能将是原生的。
这意味着,Llama 4 将能够直接处理语音信息,无需先将语音转换为文本,再将文本输入大型语言模型(LLM)进行处理,最后将输出的文本转换回语音。
Cox 认为,这种原生语音功能对于人机互動界面而言意义重大,用户可以直接与 AI 对话,询问任何问题。
" 我相信这对接口产品来说是一件大事,你可以和互联网交谈,随便问它什么。我认为我们仍在思考这有多强大。"
Llama 4:语音功能原生化
扎克伯格已多次强调,2025 年将是 Meta AI 产品的 " 决定性之年 "。为了实现 AI 技术的商业化,Meta 正在考虑多种方案。
据报道援引知情人士透露,Meta 一直特别注重使用户与其语音模型之间的对话更接近于双向自然对话,允许用户打断,而不是更僵化的问答形式。
此外,Meta 正在探索为 AI 助手 Meta AI 推出高级订阅服务,提供诸如预订服务和视频创作等功能 Meta 还在考虑在其 AI 助手的搜索结果中引入付费广告或赞助内容。
扎克伯格今年还透露了构建一个具备中级工程师能力的 AI 工程代理计划,这一项目被认为拥有 " 非常大的市场潜力 "。
Meta 的 AI 业务主管 Clara Shih 6 日在接受 CNBC 采访时表示,全球有 2 亿家小企业已经在使用 Meta 服务和平台。她预计 AI 将改变每一项工作和每一项业务,包括使用 WhatsApp、Instagram 和 Facebook 与客户建立联系的数亿家小企业。
分析认为,Meta 的 AI 语音计划不仅凸显了 Meta 在 AI 领網域的雄心,也预示着未来 AI 互動方式将更加注重自然对话,而非传统的文本主导模式。
竞争格局:OpenAI、xAI 与 Meta 的语音之战
在 AI 行业的竞争愈发激烈的背景下,Meta 正在努力回应来自竞争对手的挑战。OpenAI 去年发布的语音模式,专注于赋予其 AI 不同的人格特征,而由马斯克创办的 xAI 的 Grok 3 最近也推出了语音功能。
这些竞争促使 Meta 在新模型的安全性和使用限制方面进行深入讨论。一方面,Meta 需要确保 AI 模型的输出符合道德规范,避免产生有害或不当内容。另一方面,Meta 也希望降低模型的 " 高尚 " 程度,使其能够更自由地回答用户的问题。
此前,Meta 因其第三版 Llama 模型受到外界批评,认为其过于 " 高尚 ",拒绝回答一些无辜的问题。
除了语音能力的提升,Meta 在 AR/VR 和智能眼镜领網域的投资同样不容小觑。Meta 最近推出的 Ray-Bans 智能眼镜通过语音命令与 AI 助手互动,还加速筹备轻量级头戴设备的开发,目标是替代智能手机,成为用户的主流计算设备。