今天小編分享的互聯網經驗:全球首個對話式 AI 引擎發布,15分鍾構建的AI對話1分鍾不到1毛錢,歡迎閱讀。
(圖片來源:钛媒體 AGI 編輯林志佳拍攝)
3 月 6 日消息,钛媒體 AGI 獲悉,今日下午,實時互動技術公司聲網在北京發布對話式 AI 引擎。
據悉,該對話式 AI 引擎擁有 650ms 超低延時響應、優雅打斷、全模型适配、" 選擇性注意力鎖定 " 功能可屏蔽 95% 環境人聲等能力,僅需兩行代碼以及 15 分鍾,就可構建 AI Agent,實現從對話式 AI 引擎 Console 到任意模型開口說話,并且支持文本大模型更新為對話式多模态大模型。
價格方面,經聲網内部測算,對話式 AI 引擎 1 分鍾不到 1 毛錢,每分鍾價格為 0.098 元。同時,用戶與 AI 每產生 1 次對話中,平均會有約 3 輪問答,計算下來平均對話時長約為 21.1s,單次成本僅需 3 分錢。如果每月對話次數 15 次,那麼月成本不到 5 毛錢,年成本也只需 5 元。
會後,聲網 AI RTE 產品線負責人姚光華對钛媒體 AGI 等表示,這是全球首個對話式 AI 引擎。春節期間,團隊就開始研發這款對話式 AI 引擎,尤其 DeepSeek 熱潮帶給國内企業、科技界的正面影響,大家就如同 " 高考 " 一般将最核心產品線、研發線組建一起,并且快速推進和決策,2 月 18 日發布 Public Beta 版本,如今正式對外發布這款產品。
談及最新發布的 Manus AI Agent 產品,姚光華表示,Manus AI Agent 和對話式 AI 產品不屬于 " 一個物種 "。從底層邏輯上,對話式 AI 互動方式是一個颠覆式的,主要是對話產生情緒價值,如果能夠發展的更好,它可能會成為超越于工具以外、類似于陪伴的東西,但現在我們對 AI Agent 的認知還是 " 工具 ",替換很多你現有工具類型的價值不是終極目的,而研發對話式 AI 產品的時候,情感陪伴音色和人數都有增長。" 但我們覺得,今天早上發的(Manus)就是一個工具。"
據悉,聲網致力于打造 " 人工智能語音代理的關鍵基礎設施 ",該公司提供的 TEN ( Transformative Extensions Network ) 服務已經在 DeepSeek、阿裡通義 Qwen、階躍星辰 Step、MiniMax、Amazon Bedrock、百度、科大訊飛等 AI 企業和產品當中。比如,去年 10 月 24 日,聲網也宣布了與 MiniMax 在打磨國内第一個 Realtime API。
2 月 24 日發布的财報顯示,2024 年四季度,聲網母公司 Agora, Inc. ( NASDAQ: API)實現總營收 3450 萬美元,同比下降 4.4%;在美國通用會計準則(GAAP)下淨利潤為 16 萬美元(約合人民币 115.97 萬元),扭虧為盈。2024 财年,集團總營收 1.333 億美元,較上年同期下降 5.9%。
在姚光華看來,對話式 Agent 給用戶帶來的價值有問題得到解決的智能價值,還有情感共鳴的情緒價值以及效率躍升的時間價值。
Agent AI 從感知到智能,主要包含四層:模态感知層指的是 Agent 要感知物理世界的信息,對音視頻做處理和轉換;模态融合層指對感知到的信息進行統一多模态處理;任務處理層是面向目标和任務進行處理和解決;頂層智能層是高級認知與學習能力,具備超高情商。其中,聲網對話式 AI 引擎覆蓋模态感知層、模态融合層。
談到 " 幻覺 " 話題,聲網產品負責人和利鵬對钛媒體 AGI 表示,大模型 " 幻覺 " 是不可(完全)消滅的,但需要減少,而背後需要模型本身不斷迭代,尤其是在對話式 AI 引擎上,團隊做了很多降噪、聲音處理等問題。
" 就像咱們今天,你覺得我可能答復的未必是你,因為人和人交流之間也可能有誤解等,但是對話是有一個最好的問題,你發現他誤解了,你告訴這不是我的意思,我就打斷你,我直接告訴說我實際是這個意思,人和人交流都是這樣。" 和利鵬表示,人和人交流的時候都會有幻覺,因為二人的知識、背景都不一樣。此外,上下文增多、推理 CoT(思維鏈)的不斷加強,都是減少模型 " 幻覺 " 的重要方案。
姚光華指出,目前對話式 AI 引擎可以應用于很多陪伴式智能硬體以及教育場景等。
聲網創始人兼 CEO 趙斌表示,生成式 AI 為我們帶來了變革性機遇,特别是在實現人與人工智能模型之間的實時語音互動方面。許多大型語言模型尚未提供語音互動功能,而提供語音互動功能的模型也沒有優化體驗。為了彌補這一差距,公司推出對話式 AI 引擎解決方案,旨在提供自然的對話動态,包括智能停頓和打斷處理、高級語音處理功能以及超低延遲。
" 過去的幾個月裡,我們已經看到了從 AI 推理模型到谷歌多模态的突破性發展,這一轉型為我們的業務帶來了非凡的機遇。" 趙斌強調," 我們堅信,這一突破性創新将加速對話式 AI 在各行業的應用滲透,并成為公司未來增長的核心驅動力。"
(本文首發于钛媒體 App,作者|林志佳)