今天小編分享的科技經驗:理想同學App實測:車企造的AI應用,除了視覺,其他都很一般,歡迎閱讀。
誰曾想,ChatGPT 最大的對手會是一家汽車廠商打造的人工智能 App 呢?
2023 年 6 月,理想汽車推出了自研認知大模型 "Mind GPT",它以 " 理想同學 "App 的形式出現在理想汽車的車機中,支持通過自然語言交流、發送指令。2024 年,Mind GPT 更新到 3.0,帶來了行業領先的自然語言任務執行功能。理想汽車創始人李想在 2024 年 25 日舉行的 AI Talk 特别活動中提到,理想同學已經是理想車主們最愛的功能之一,如今理想要讓更多用戶用上理想同學。
(圖源:理想同學)
今日,理想同學 App 如期登陸 App Store。為了弄清楚車企打造的首個通用人工智能應用程式到底表現如何,雷科技第一時間下載了這款應用,并将它與 Kimi、豆包、ChatGPT 等熱門應用來了一場比拼。
理想同學 App 的設計相當簡潔,但卻不夠明了。App 圖示是簡筆畫風格的一雙眼睛,有人覺得這和蔚來的 Nomi 有點像,對比下來,小雷感覺蔚來 Nomi 還是要更可愛一些。可相比起其他 AI 應用的 " 賽博風 ",理想同學倒是有幾分親近感。
(圖源:雷科技制圖)
啟動 App 後,理想同學會跳出歡迎界面,随後就是注冊 / 登陸請求。理想同學沒有限制必須理想車主才能使用,因此小雷的整個登陸過程都是相對順利的。相較之下,豆包的登陸更像是開始一場遊戲,它需要你建立昵稱、性别等個人資料,Kimi、ChatGPT 和理想同學都沒有這個要求。
雖然理想同學整體就是黑 + 白配色,沒有啟動廣告、也沒有任何内容推薦,甚至連教程都沒有。或許理想是默認多數會下載理想同學的用戶都不是 " 新手小白 "。
有趣的是,理想同學的推薦問題往往都是投資、科技類話題,而豆包則是偏生活常識類,這或許就是它們各自定位的巨大差異。另外,Kimi、豆包都會将能夠實現的功能放在輸入框附近,這能讓用戶快速了解到它們到底能做些什麼。比如豆包把 AI 生圖、AI 翻譯、AI 寫作都列了出來,Kimi 也把翻譯和寫作單獨顯示,但理想同學卻沒有這麼做。
當你開始提問後,理想同學會顯示一段非常炫酷的動畫,展示它理解、搜索、學習、總結的過程。在開始回答問題後,這段思考過程會被折疊。小雷認為這段動畫沒有什麼必要存在,畢竟每個大模型的生成過程幾乎都是一樣的,這段動畫也說明不了什麼,而且還相當占位置。
只能說,對于這個剛剛上線的人工智能應用來說,理想算是很努力地做減法,走極簡化風格使其在視覺上足夠高級,但這類應用最重要的還是要 " 好用 ",而不是 " 好看 "。不夠直觀的互動,上手門檻就被無形中抬高了不少。
聊完設計與使用上的體驗,也是時候到實測環節了。
本輪測試主要分為三個環節,包括基礎問答、内容生成和連續交流。小雷為理想同學挑選的對手有豆包、Kimi 和 ChatGPT。話不多說,我們直接開始 PK 吧。
第一輪是基礎問答橫評,我們選擇了理想同學推薦的 " 馬斯克 xAI 為何能吸引 60 億美元投資 " 這個話題,對四款人工智能應用進行提問。
總結速度方面,理想同學從開始搜索到生成回到大約花費了 3 秒時間,而豆包、Kimi 分别需要 6、7 秒時間,ChatGPT 和理想同學的生成時間相近。而内容上,四款應用都有從市場、背景、技術戰略等多方面進行論述,但只有 Kimi 能夠結合 xAI 當前的狀況詳細描述,比如提到 xAI 截至 5 月已經融資超 120 億美元,這節省了我們後續提問的時間。
(圖源:雷科技制圖,從左到右為:Kimi、理想同學、豆包、GPT)
整體來看,目前主流人工智能應用在基礎問答基本都做得不錯,比如資料檢索能力、整合能力和生成能力,即便是初出茅廬的理想同學也能穩拿六十分。當然,體驗下來,小雷認為 Kimi 的優勢在于總結的資料更全面,豆包的優勢是能直接推薦今日頭條、抖音上的解說視頻。
第二輪是内容生成,我們挑選了 " 雷科技即将前往美國參展 CES2025,請根據這個由頭編寫一篇宣傳導語 " 這個任務,讓四個人工智能應用自由發揮,幫我們寫一篇宣傳語,看看他們各自的表現如何。
從生成的内容上看,豆包和理想同學都能了解到小雷的需求是 " 宣傳導語 ",因此内容篇幅不會太長,滿足社交平台或文章尾部的宣傳需求;Kimi 的内容是四款人工智能應用中最長的,甚至還包括了 "2025 年 1 月 7 日 -10 日 " 這個準确的時間,但可惜就是太長了,而且還把雷科技認錯成參展商。至于 ChatGPT,内容就比較平平無奇了,而且 AI 味也很重,實用性不佳。
(圖源:雷科技制圖,從左到右為:理想同學、豆包、Kimi、GPT)
我們又将理想同學推薦的問題 " 谷歌 AI 如何在生成視頻和影像上實現突破 " 為命題作文,要求四款應用按照這個主題寫一篇文章。不過,測試下來,Kimi、豆包、ChatGPT 都能按要求寫一篇文章,雖然水平參差不齊,但至少還是能完成要求,而理想同學則是回答了這個問題,并不能獨立完成寫作。
(圖源:雷科技制圖,從左到右為:Kimi、豆包、理想同學、GPT)
這樣看來,理想同學倒不是完全不能寫作,只是過大的命題對于它而言還是有一定難度,從内容完成度來看,其實也只有豆包算得上是完成了一篇正規的文章寫作,Kimi 更多還是以資料舉證為主,沒有分析和論述。只能說,理想同學在寫作這塊還是得加油。
值得一提的是,目前 Kimi 和理想同學都不支持影像生成,其實也算是時下主流廠商推出的人工智能應用裡比較罕見的不支持影像生成模型技術的應用了。
第三輪,我們迎來了這次體驗的重頭戲:視覺模型對比。由于 Kimi 不支持視覺模型、豆包只支持語音模型,這次的對比主要還是理想同學和 ChatGPT 之間的對決。
理想同學和 ChatGPT 都能通過攝像頭對現實物體進行識别,但兩者的處理方式有些區别,前者只有在用戶發出需求時才會給予回應,例如識别物品是什麼、人物是誰等;而 ChatGPT 更傾向于實時交流,只要攝像頭采集到畫面,它就會開始與你交流。
(圖源:雷科技制圖,左為 GPT、右為理想同學)
體驗下來,單純聊物體的識别能力的話,兩者可以說幾乎沒有差距,像是生活中常見的礦泉水、電腦,都能認出來。而犯的錯誤也幾乎一樣,比如認不出新款的手機,或是冷門的數碼產品等。但是在速度上,理想同學的表現還是很不錯的,而且它的語音識别能力很強,能準确分析你是真的在向他提問還是在與旁人交談,避免了錯誤的實時分析。
而在植物的識别上,理想同學能夠識别出園區種植的觀賞性植物是冬麥,并且給出了一些簡單易懂的資料,而 GPT 卻認為那些草是韭菜。當我繼續追問 " 這些觀賞性植物真的是韭菜嗎?",GPT 建議我可以詢問工作人員。不得不說,理想同學在這方面的識别能力幾乎是完勝 ChatGPT。
(圖源:雷科技制圖,左為理想同學、右為 GPT)
當然,理想同學也并不是方方面面都勝于 ChatGPT,比如我問它今天的天氣看起來怎麼樣時,理想同學始終會引用氣象資料來判斷,而非識别實景;ChatGPT 就會告訴我現在的天氣看起來不錯,但可能需要穿件外套,避免着涼。
對比下來,理想同學作為一款剛剛上線的人工智能應用,在處理基礎任務時已經和 Kimi、豆包、ChatGPT 這些老玩家相差無幾,但要說到文字創作、内容生成,可能還是略顯生澀。而理想同學目前最大的優勢是視覺模型表現很不錯,這可能是 Mind GPT 的數據模型與大量的視覺需求有關。
在日前舉辦的 "AI Talk" 特别直播活動中,李想透露自 Mind GPT 在理想汽車上線後," 理想同學 " 累計喚醒次數達 23.8 億次,任務完成率 96%,用戶滿意度 96.2%。作為車企推出的車機 AI 助手,能夠這樣的喚醒率,表現确實不錯。
但理想為何要把車機的 AI 助手搬到應用市場上,與一眾老玩家們硬碰硬呢?
實際上,李想在 2023 年就曾通過内部信提到理想汽車的未來願景——至 2030 年,要成為全球領先的人工智能企業。在 "AI Talk" 活動中,理想也宣布全面進軍 AI 市場,理想造的汽車也不是 " 汽車 ",而是 " 人工智能機器人 "。這其中最重要的一環,自然是大模型技術。
時下,幾乎所有人工智能企業都擁有公開的 AI 應用,百度的文心一言、谷歌的 Gemini,即便是沒有造出一款全新的 AI 應用,也計劃在主流產品中全面 AI 化改造,例如馬斯克的 "xAI" 計劃。因此,想要大眾認可理想是一家人工智能企業,最好的辦法就是通過部署一款每個用戶都能輕松下載到、使用到的應用——理想同學。
對于理想而言,理想同學上線應用市場,這意味着将會有更多普通用戶加入其中,共同訓練 Mind GPT,使它變得更加完善,無論應對任何場景,都能有更好的應對方式。此前,Mind GPT 主攻的場景是 " 任務主導型 AI",即用戶給一個清晰的指令,理想同學負責執行便可。但這對于要 " 造人工智能機器人 " 這個願景而言,還遠遠不夠。
而體驗下來,理想同學距離 Kimi、豆包、ChatGPT 等專業 AI 玩家仍有不小差距,尤其是面向創作方向的特性,理想同學差的不是一星半點。假如理想要讓消費者們認可 " 理想是一家人工智能企業 ",或許要加快理想同學更新,跟上主流 AI 應用腳步。