今天小編分享的互聯網經驗:大模型獨角獸MiniMax将于11月發布首款對标GPT-4o的端到端實時語音對話API產品,歡迎閱讀。
(圖片來源:钛媒體 App 編輯林志佳拍攝)
钛媒體 App 10 月 25 日消息,钛媒體 App 獨家獲悉,AI 大模型領網域的獨角獸 MiniMax 将于今年 11 月發布對标 GPT-4o 的 Realtime API 服務,将提升端到端實時多模态處理能力,并帶來更低延時、更自然、更沉浸的實時語音對話,為企業協作、社交、直播、遊戲等多種場景提供服務。
這是 MiniMax 推出的首款端到端實時語音對話產品。消息人士告訴钛媒體 App,内部正在打磨這款產品,并非常希望 11 月發布時產品效果直接對标 OpenAI GPT-4o。
據悉,今年 5 月,OpenAI 公司推出可免費使用的全新旗艦 AI 模型 GPT-4o,可實時進行音頻、視覺和文本推理,它可以在短至 232 毫秒、平均 320 毫秒的時間内響應音頻輸入,與人類在對話中的反應速度一致。在 API 使用方面,相比去年 11 月發布的 GPT-4-turbo,GPT-4o 價格降低一半(50%),速度提升兩倍(200%)。
OpenAI CEO 奧爾特曼(Sam Altman)在推文中表示,新的 GPT-4o 是 OpenAI 有史以來最好的模型,它很智能,速度很快,是原生多模态,并且它可供所有 ChatGPT 用戶使用,無論是免費版本還是付費 GPT-4 版。
今年 10 月,實時語音技術公司、聲網的兄弟公司 Agora 作為語音 API 合作者出現在了 OpenAI 發布的 Realtime API 公開測試版中。而 MiniMax 也看到了機會,開始與聲網進行合作,聲網創始人兼 CEO 趙斌在 RTE 2024 第十屆實時互聯網大會上表示,聲網與 MiniMax 正在打磨中國第一個 Realtime API,基于該 API 的智能體產品,能夠與人類進行輕松且流暢的實時語音交流。
除了 MiniMax,目前包括科大訊飛、智譜 AI、商湯科技等中國企業都在研發生成式 AI 對話產品,均與 GPT-4o 效果不相上下,OpenAI 近期也開放了 ChatGPT-4o 對話功能。
根據艾瑞咨詢的統計,2021 年,對話式 AI 的市場規模為 45 億元,帶動規模 126 億元。預計 2026 年,對話式 AI 市場規模将達 108 億元,帶動規模超 385 億元,五年復合年均增長率(CAGR)達 32.5%。
(本文首發于钛媒體 App,作者|林志佳,編輯|胡潤峰)