今天小編分享的科技經驗:首款内置ChatGPT的智能音箱?可能和想的不太一樣,歡迎閲讀。
2023 年整個科技界最火的無疑是以 ChatGPT 為代表的 AI 大模型,因此也使得蹭 ChatGPT 的熱度俨然成為了諸多相關企業的必備技能。日前有消息顯示,号稱全球首款内置 ChatGPT 的智能音箱 Vifa ChatMini,就将于 8 月 17 日全球首發。根據推出這款智能音箱的智度股份官方公眾号的説法,這款產品内置了 ChatGPT 和百度文心一言雙 AI 大模型,在智能化方面将擁有 " 巨大飛躍 "。
比傳統音箱具有更小的體積、更強便利性的同時,還内置了 ChatGPT、文心一言,這真的可能嗎?答案是可以做到,但實現方式可能與大家理解的完全不同。
在許多朋友的理解裏,内置 ChatGPT 或許更接近于傳統的端側智能,也就是将 AI 大模型本地化部署在智能終端上。但截至目前,還沒有哪一家廠商在真正意義上實現了這一點。
即使是華為方面在剛剛發布的 HarmonyOS 4 上,也僅僅只是表示将 AI 大模型能力内置在系統底層。而且在大模型接入後,華為智慧助手 " 小藝 " 也只是在語音互動的基礎上,擴展了文字、圖片和文檔等多種形式的輸入,自然語言理解能力得到提升,還能根據指令連接多種服務和場景,比如自動提取圖片文字、生成各類商業電子郵件内容或生成影像等。
此前,高通產品管理高級副總裁兼 AI 負責人 Ziad Asghar 在接受媒體采訪時,也給出了謹慎的回應," 本年度我們将能夠支持參數達 100 億的生成式 AI 模型在手機上運行,這意味着未來大多數的用例将能夠完全依靠手機端就能夠完成 "。
但要知道的是,相比智能手機的 SoC,智能音箱使用的芯片在算力上可以説是有着質的差距,目前即使智能手機都暫時還沒能實現在端側部署 AI 大模型,就更遑論智能音箱了。
事實上,這款 Vifa ChatMini 智能音箱實現用户使用 ChatGPT 的方式,極有可能與如今 iOS/Android 用户一樣,是在設備裏下載了一個 ChatGPT 的 App 而已,同樣都是通過雲端來部署。此時,大模型和計算資源都存儲在 OpenAI 的伺服器上,用户通過與伺服器的實時互動,輸入的内容經 OpenAI 伺服器處理後再獲得響應。
簡單來説,以現階段智能音箱的算力水平,是不可能支持擁有 1750 億參數規模的 ChatGPT,所以用聯網的方式來獲取 ChatGPT 的能力才更靠譜。
那麼問題來了,消費者真的需要一個内置 ChatGPT 的音箱嗎?其實最有可能的情況,是憑借内置 ChatGPT 的噱頭或許會在最初引得一批用户嘗鮮,但緊接着它的弊端就會讓更多消費者對其敬謝不敏了。
如今毫無疑問的是,智能音箱的賣點是 " 智能 "、而非 " 音質 ",并且這一點諸如騰訊聽聽、蘋果 HomePod 等一系列注重音質的產品,已經用慘烈的市場表現佐證了。随着家電產品的智能化浪潮,消費者确實需要一個通過語音操控的智能化工具來 " 總領全局 ",所以智能音箱就很好的扮演了這個角色。諸如播放音樂、講故事、查看天氣、控制其他設備開關的工作,智能音箱就完成的很好。
然而智能音箱在經歷了此前的高光時刻之後,直接就朝着谷底一去不回了,這是因為消費者發現智能音箱也只能做好放音樂、看視頻、講故事、查天氣的工作。由于 ASR(語音識别)、NLP 自然語義處理、遠場拾音等人工智能和聲學技術進步的速度,沒能趕不上用户的需要,導致了消費者認為智能音箱不智能。所以内置 ChatGPT 的 Vifa ChatMini 就在這一背景下誕生了,既然智能化程度不高,那就直接上當下最智能的 ChatGPT 來補全不就可以了。
但很可惜,ChatGPT 或許并不太适合智能音箱。因為廠商想象中,内置 ChatGPT 的智能音箱就能實現更豐富的對話、情感陪護等工作,實際上是有門檻的,而且也是現階段 ChatGPT/GPT-4 做不到的事情。
事實上,用好 ChatGPT 是有一定門檻的,這點相信是使用過 AI 大模型的用户的共識。其實它在某種意義上與幾年前走紅的 3D 打印非常類似的,盡管看上去很美好,但用起來會很快發現完全不是一回事。
借助 3D 打印,似乎用户需要什麼就能打印什麼,不需要用户具備相關專業技能也可以 " 心想事成 ",但實際上這裏需要創建 3D 模型,并且對 3D 模型進行修整、拆分、組合。ChatGPT 也是如此,它需要有所謂的提示詞(Prompt),用户使用 ChatGPT 也基本停留在對話上,并難以挖掘出更多的能力。簡單來説,ChatGPT 是一座寶藏,但是絕大多數人并不懂得如何去挖掘它。
遺憾的是,即便是對話,在 AI 倫理以及合規的約束下,目前的 ChatGPT 和半年前的版本已經不是一回事了。OpenAI 乃至微軟為了系統的安全性、魯棒性,以及合規,選擇了負優化 AI 大模型,來提高系統的穩定性和可控性,ChatGPT、GPT-4、Bing Chat 都已經被許多專業人士發現出現了性能大幅下降的情況。這也就意味着 ChatGPT 的輸出變得更加可預測,實際上它也已經被部分用户吐槽回復缺乏新鮮感和創新性。
想要讓 ChatGPT 重新變得聰明,通過精心設計的提示詞讓 ChatGPT 跳出 OpenAI 劃定的範圍,是最為直接的方式。可大多數人并不具備構建高質量提示詞的能力,所以很容易就會陷入 ChatGPT 用着用着就越來越無聊的情況。而智能音箱的消費者顯然基本是未受過相關訓練的,因此可以預見的是,大多數消費者在購買了内置 ChatGPT 的音箱後,會發現它與以往用過的智能音箱并沒有太多差異。
因此一款有隐性使用門檻的消費類電子產品,高開低走再正常不過了。
【本文圖片來自網絡】