今天小編分享的互聯網經驗:Meta發力AI Agent,Llama 4将實現直接語音對話,歡迎閱讀。
Meta 正發力 AI Agent,尤其是在端側 AI 和語音互動方面。公司計劃将在未來幾周内推出的 Llama 4 中引入更強大的語音功能。
據英國《金融時報》報 7 日報道,Meta 首席產品官 Chris Cox 在摩根士丹利技術、媒體和電信會議上透露,Llama 4 将是一個 " 全能模型 ",語音功能将是原生的。
這意味着,Llama 4 将能夠直接處理語音信息,無需先将語音轉換為文本,再将文本輸入大型語言模型(LLM)進行處理,最後将輸出的文本轉換回語音。
Cox 認為,這種原生語音功能對于人機互動界面而言意義重大,用戶可以直接與 AI 對話,詢問任何問題。
" 我相信這對接口產品來說是一件大事,你可以和互聯網交談,随便問它什麼。我認為我們仍在思考這有多強大。"
Llama 4:語音功能原生化
扎克伯格已多次強調,2025 年将是 Meta AI 產品的 " 決定性之年 "。為了實現 AI 技術的商業化,Meta 正在考慮多種方案。
據報道援引知情人士透露,Meta 一直特别注重使用戶與其語音模型之間的對話更接近于雙向自然對話,允許用戶打斷,而不是更僵化的問答形式。
此外,Meta 正在探索為 AI 助手 Meta AI 推出高級訂閱服務,提供諸如預訂服務和視頻創作等功能 Meta 還在考慮在其 AI 助手的搜索結果中引入付費廣告或贊助内容。
扎克伯格今年還透露了構建一個具備中級工程師能力的 AI 工程代理計劃,這一項目被認為擁有 " 非常大的市場潛力 "。
Meta 的 AI 業務主管 Clara Shih 6 日在接受 CNBC 采訪時表示,全球有 2 億家小企業已經在使用 Meta 服務和平台。她預計 AI 将改變每一項工作和每一項業務,包括使用 WhatsApp、Instagram 和 Facebook 與客戶建立聯系的數億家小企業。
分析認為,Meta 的 AI 語音計劃不僅凸顯了 Meta 在 AI 領網域的雄心,也預示着未來 AI 互動方式将更加注重自然對話,而非傳統的文本主導模式。
競争格局:OpenAI、xAI 與 Meta 的語音之戰
在 AI 行業的競争愈發激烈的背景下,Meta 正在努力回應來自競争對手的挑戰。OpenAI 去年發布的語音模式,專注于賦予其 AI 不同的人格特征,而由馬斯克創辦的 xAI 的 Grok 3 最近也推出了語音功能。
這些競争促使 Meta 在新模型的安全性和使用限制方面進行深入讨論。一方面,Meta 需要确保 AI 模型的輸出符合道德規範,避免產生有害或不當内容。另一方面,Meta 也希望降低模型的 " 高尚 " 程度,使其能夠更自由地回答用戶的問題。
此前,Meta 因其第三版 Llama 模型受到外界批評,認為其過于 " 高尚 ",拒絕回答一些無辜的問題。
除了語音能力的提升,Meta 在 AR/VR 和智能眼鏡領網域的投資同樣不容小觑。Meta 最近推出的 Ray-Bans 智能眼鏡通過語音命令與 AI 助手互動,還加速籌備輕量級頭戴設備的開發,目标是替代智能手機,成為用戶的主流計算設備。