今天小編分享的互聯網經驗:實測智譜AutoGLM沉思:用DeepSeek的方式幹Manus的活,還全部免費?,歡迎閲讀。
當深度思考遇上 Agent,真全能的 AI 來了?
智譜 AI 在 OpenDay 上發布了全球首個集深度研究和操作執行于一體的 Agent 產品—— AutoGLM 沉思。有别于大多數只會打嘴炮的 AI,這款号稱 " 邊想邊幹 " 的產品不僅能思考,還能實時操作浏覽器,像真人一樣打開網頁、檢索信息、生成報告。
我們第一時間進行了一手評測,用三個實際工作場景測試後不得不説:這次不是 PPT 產品,這次是真的能用!
通用 Agent 一直面臨的最大難題是 C 端場景過于復雜多變,導致穩定性和準确性難以保證。智譜通過 " 先思考再執行 " 的策略解決了一部分準确性的痛點。AutoGLM 沉思會先制定完整研究計劃,再一步步執行,最後進行系統總結,大大降低了幻覺率和操作失誤率。
AutoGLM 沉思之所以能真能用,關鍵在于其背後的技術棧。它基于智譜自研的推理模型 GLM-Z1-Air 訓練,這個模型号稱性能比肩 DeepSeek-R1,但速度提升最高 8 倍,價格僅需其 1/30。深度推理能力讓它不僅能像 OpenAI 的 Deep Research 一樣進行深度思考,AutoGLM 框架則賦予了它真實的操作能力,能自動浏覽和操作網頁,獲取更多高質量信源。
而且對于打工人來説,AutoGLM 沉思完全免費且不限次數使用,現場智譜用它演示了 " 如何賺到 100 塊錢 " 以及 "14 天小紅書起号計劃 ",我們實測下來,AutoGLM 沉思打破了 " 通用 Agent 等于玩具 " 的刻板印象,不過由于 " 邊想邊幹 " 的工作方式,它完成一項復雜任務往往需要 5-20 分鍾不等,效率确實有待提高。但考慮到它能完成的任務復雜度和準确性,這個時間成本其實已經比人工低得多。
當深度調研與實際操作能力相結合,通用 Agent 終于要從概念走向實用了?
以下是硅星人針對自媒體常見三個場景:熱點分析、财務分析和計劃制定,對 AutoGLM 進行了實測。
一、熱搜話題評論分析
我讓 AutoGLM 沉思分析一下微博上關于 " 胖東來店長月薪近 8 萬 " 這個熱門話題的主要觀點、大概占比和能得出什麼結論,AutoGLM 沉思整個運作的過程如下。
本文視頻均經過倍速處理
接到任務後,AutoGLM 沉思先去了解了胖東來這家公司和這個話題的基本情況,确認了消息來源和薪資數據。它嘗試直接去微博抓取和分析讨論,但好像遇到了點技術困難,可以抓取微博帖子,但沒法直接看大量的評論。
于是,它換了個思路,開始廣泛搜索相關的新聞報道、創始人于東來的發言、以及其他社交平台(像知乎、小紅書)上關于這個話題的讨論和帖子。通過閲讀這些替代來源的信息,特别是小紅書上的一些帖子和評論。
最終還是給出了一個信息量豐富、邏輯清晰的分析報告。值得注意的是不僅回答了我的問題,還深挖了背景信息和商業邏輯,讓結論更有説服力。
從這個過程來看 AutoGLM 沉思挺靈活,路子堵了知道換條道走,最後還是把任務完成了。不足是因為沒直接看微博,觀點比例是靠其他平台的信息,沒有嚴格遵守用户的要求,如果能直接處理微博數據,分析會更扎實。
二、特斯拉股票分析
我們讓 AutoGLM 深思做一份全面的特斯拉股票分析報告,要求包含财務、市場情緒、技術面、競品對比等方面。
AutoGLM 深思接到任務後,先是搜集了特斯拉的基本情況和最新動态,了解了大概的業績。然後它開始深入挖掘,找詳細的财務數據,雖然嘗試直接讀官方年報沒成功,但還是從其他财經網站把關鍵數據(像營收、利潤、現金流)扒拉出來了。接着,它又去查了分析師們怎麼看這只股票、市場情緒怎麼樣、股價圖走勢如何,還重點比較了特斯拉和比亞迪等競争對手的優劣。
最後,它把這些信息匯總起來,從價值投資的角度分析了潛力和風險,做了個 SWOT 總結,并針對不同類型的投資者給出了建議,形成了一份詳細的報告。
和上面熱搜評論分析的情況類似,AutoGLM 深思能按照給出的框架一步步去搜集和分析信息,覆蓋面很全。即使遇到信息獲取的小障礙(比如直接讀年報失敗),也能換個途徑把任務完成。不過整個過程看起來挺繁瑣,搜了很多次,花了些時間。
實際上這個股票分析的任務也是 Manus 的官方案例之一(https://manus.im/share/xFgpHb15vKqfRPWIs3JJPJ?replay=1),對比兩個產品完成任務的過程來看,Manus 像一個自動化分析師 + 開發者。它明确地執行計劃、調用工具、獲取特定數據(如股價、财務指标)、進行計算(如 DCF 估值、技術指标)、生成圖表,并且過程非常透明,用户能看到它一步步在做什麼。除了生成了詳細報告,還做出了一個互動式的數據看板。AutoGLM 沉思在信息搜集和總結方面做得不錯,但顯得工具化和分析能力稍弱一些。
三、日本七日遊旅行計劃
我們繼續讓 AutoGLM 沉思和 Manus 同題 " 打擂 ",讓 AutoGLM 沉思規劃為一對美國公民規劃一個 4 月中從西雅圖出發的 7 天日本行程:預算在 2500-5000 美元,喜歡歷史文化(特别是劍道、茶道)、想看奈良的鹿,而且打算在這次旅行中求婚,需要推薦個特别地點,最後還要個簡單的網頁版旅行手冊。
接到任務後,AutoGLM 沉思先去查了西雅圖到東京的班機大概價格和時間,确認了美國公民去日本不用籤證。然後它研究了在日本幾個城市間怎麼走最方便(主要是新幹線),接着就針對興趣點(歷史、文化體驗)去搜東京、京都、奈良的景點和活動,特别找到了東京可以體驗茶道和劍道的地方(從小紅書上找的信息)。還查了 4 月份天氣怎麼樣,并且根據别人的經驗推薦了東京塔下的公園作為求婚地點。
最後,它把這些信息整合起來,做了一個每天的詳細行程安排,加了些日語短語和旅行提示,還生成了一個簡單的 HTML 格式的旅行手冊,但可視化程度有限,基本上是提煉了一些要點。
總結:
對比來看,AutoGLM 沉思強項是資料獲取和信息收集,但過程有點 " 黑箱 ",不太清楚它怎麼篩選信息、怎麼做的決策,但遇到問題知道換個法子試試,很喜歡小紅書這類社交平台,這讓它可能更擅長找到一些普通用户分享的、非官方的、甚至有點 " 網紅 " 性質的地點或體驗。這可能是個優勢,能挖到那種更依賴官方或結構化數據的 AI 找不到的信息。對于想直接 " 抄作業 " 的用户來説,可能更直接、更省事。
而 Manus 的過程(https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1 任務演示視頻)更透明,用的方法更多樣,最後給的東西(行程、求婚指南、手冊分開)更規整、更專業。
整體來看,經過這次 AutoGLM 沉思的評測體驗,雖然有一些槽點,但不得不説,AutoGLM 沉思給人的印象确實是勤奮得令人印象深刻,而且考慮到其免費特性,它很可能是你能接觸到的最好用的免費 AI 勞動力了。它就像一位不知疲倦的實習生,默默在後台為你搜集信息、整合分析,而且完全免費。這意味着你可以放心嘗試各種不同場景,探索它的能力邊界。免費的最大好處就是極低的試錯成本,用户可以放心地讓它嘗試各種不同的應用場景和任務。探索它的能力邊界。
當然,它也有明顯的短板。任務處理速度不算快,有時一個分析可能需要半小時以上。不過好在你不必幹等着,完全可以讓它在後台默默工作,自己去處理其他事情。唯一的小煩惱是,它會不時地自動打開新網頁,如果你正在 Chrome 浏覽器中工作,可能會有些幹擾。
這或許是人類與 Agent 之間的第一次 " 領地争奪戰 " ——誰才是電腦的真正主人?(笑)