今天小編分享的科技經驗:阿裡 3800 億大目标之後,第一步是推獨立 Qwen App,歡迎閱讀。
今天一早,撲面而來的信息流提示「又是搬磚的一天」,QwQ~~
- 02:30,Anthropic 帶着它的 Claude 3.7 Sonnet 混合推理模型來了,推理能力 next level;
- 05:01,阿裡雲 Qwen Chat 首次官宣 Thinking ( QwQ ) 模式,由一個叫做 QwQ-Max-Preview 的推理模型預覽版支持;
- 10:24,DeepSeek 開源周 Day2 打卡,今天開源的是 DeepEP,用于 MoE 模型訓練和推理的 EP 通信庫,繼續努力掃除讓開發者高效部署模型的障礙;
- 10:50,特斯拉官宣在華正式發布「FSD 功能」,軟體版本為 2024.45.32.12,更新名稱為城市道路 Autopilot 自動輔助駕駛……
一眾信息流中,不少網友一眼發現了今天的大戲。因為 Qwen 推理模型「QwQ-Max 預覽版」的亮相,剛好趕上了也在今天官宣模型推理能力大跨越的 Anthropic,後者搶走了不少注意力。但其實 QwQ-Max-Preview 已經足夠出色,包括思維鏈過程。
截圖來源:X
Qwen 團隊稱,今天在 Qwen Chat 中發布的「Thinking ( QwQ ) 」模式,由 QwQ-Max-Preview 推理模型支持,後者基于更強大的基座模型 Qwen2.5-Max 而來,在數學理解、編碼、agent 等方面具有很強的能力。與 Qwen2.5-Max 相比,QwQ-Max-Preview 也更加智能,更具創造力。
我們也在第一時間感受了一把「QwQ」的實力。開源系列模型一年半以來,這次也是 C 端用戶第一次可以直接用到 Qwen 家族的推理模型能力。
01 QwQ,一本正經思考的小大人
先來看看「QwQ-Max-Preview」擅長的數學、代碼能力。
開啟深度思考 + 聯網搜索,問他「QwQ-Max-preview 中有幾個 Q」?它不僅準确數出了兩個 Q,還能結合聯網信息拆解我的提問,額外回答了兩個 Q 的含義。有被驚喜到~
截圖來源:chat.qwen.ai(篇幅所限,未截圖思維鏈過程)
搜索了一段提示詞做「emoji 表情跳舞」小遊戲,點擊推理模式下的 Artifacts 功能輸入這段提示詞,它自動寫完代碼的展示頁面如下。不會寫代碼的用戶表示從 0 到 1 的小遊戲初體驗還挺上頭。
在代碼和數學能力上,X 平台有更專業對口的網友評測。這分别是一位魔搭社區維護者和 TikTok 研究員的體驗,在專業的數學競賽題目和代碼題目上,QwQ-Max 預覽版的完成度均比較高。
另外,也試了試平時使用頻率較高的兩個場景:創意寫作和聯網搜索功能。
其思考過程和結果,都可以清晰理解用戶意圖、完整地給出答案。整個輸出過程花了幾秒。|截圖來源:chat.qwen.ai
當問到「如何評價近日中國科技公司包括阿裡巴巴,正在被全面重估的觀點?這背後有多少可以支撐的論據?」時,thinking+ 聯網搜索下的 Qwen 可以幫助人類節省閱讀文獻的時間,總結是相對清晰完整的。
Qwen Chat 網頁最下方也會提醒你,「深度思考 ( QwQ ) 是一個預覽模型,仍在更新中」。當前的 QwQ 展現出了連貫清晰的思考過程、以及推理結果,整體像一個一本正經思考的小大人。
但在像 DeepSeek 一樣「放飛自我」能帶來一些「out of box」思考的能力上,QwQ 預覽版仍有進步的空間。這是問 QwQ-Max-Preview 和 DeepSeek-R1 同一個問題時對比圖——「通義千問團隊今天更新了 QwQ 的模型?為什麼起名叫 QwQ?這個名字怎麼讀?」
DeepSeek 可以精準檢索到網頁,給出「QwQ 的全稱為 Qwen with Questions,體現了模型的設計理念:通過『提問、質疑與反思』的機制,模拟人類思考過程,深化對復雜問題的理解。QwQ 的官方發音為 **/kwju ː /**,類似于英文單詞「quill」(羽毛筆)的讀音」,還可以提出自己的思考與結論「QwQ 的命名與設計均圍繞「以問題驅動思考」的哲學理念展開,其發音與符号化名稱增強了技術傳播的趣味性。該名稱結合了技術标識(Qwen 系列)與拟人化元素(QwQ 的表情符号化寫法),既體現了與通義千問大模型家族(Qwen)的關聯,又通過符号化的「顏文字」風格增強了傳播親和力。」
比起小老哥 DeepSeek 的放飛自我,QwQ 自帶嚴謹的老幹部。相比之下,回答就中規中矩了。
02 Qwen App,馬上來
值得注意的是,昨天晚上,Qwen 的官方推特就預告了 QwQ 預覽版的發布,以及一個 qwen.ai 的新網域名。
對此,一位行業人士向極客公園表示,新網域名意味着阿裡雲可能要做技術品牌了,「他們本身模型能力很強,甚至一些維度裡面肯定是超越 DeepSeek 的,也是國内最快追平 DeepSeek 的公司,但對于服務十億用戶的公司來說,更重要的是要保證完整的體驗。」
去年 12 月,AI 應用「通義」正式從阿裡雲分拆,并入阿裡智能信息事業群。調整後,通義的 PC 及 App 團隊将與智能搜索產品「誇克」處于同一層級,共同在阿裡智能信息事業群下發揮作用。
原有的通義實驗室仍将保留在阿裡雲體系内,繼續其研發工作。
但對于阿裡雲通義千問團隊不斷推出的新模型,仍需要一個 Kimi、豆包們來保證完整的用戶體驗,至少用戶可以在第一時間通過更方便的網頁和 App 體驗到最新的模型能力,而不只是 API。現在看來,暫時不做 AI 應用、專注 AGI 探索的 DeepSeek 在去年底推出 DeepSeek App 也是出于一樣的考量。
随着「DeepSeek 牆内開花牆外香」引發的好評如潮,在全球開發者中感知度更高的「Qwen」也比「通義」更适合做阿裡雲的技術品牌。
此前,MiniMax 創始人闫俊傑稱,開源能加速技術生态構建,提升品牌影響力,「如果重新選擇,應該第一天就開源」。阿裡雲正是國内最早選擇開源路線的模型廠商。
自 2023 年 8 月以來,通義千問系列模型的開源也獲得了一批開發者生态和優質模型的品牌心智。阿裡雲相繼開源了全尺寸、多模态的 4 代模型。根據全球最大 AI 開源社區 Hugging Face 最新顯示,截至目前,Qwen 開源大模型的衍生模型數量已突破 10 萬,穩居全球最大開源模型榜首。
現在,這個用戶體驗閉環即将通過一個新網域名的網頁和新 App,随着 QwQ-Max 正式版的到來,同時推出,「very soon」!(可能是下個月?下周?)
今天 QwQ-Preview 版的官宣中就藏着這一彩蛋,「很快,我們将發布 QwQ-Max 的正式版本,并将在 Apache 2.0 許可下開放 QwQ-Max 和 Qwen2.5-Max!此外,我們還将提供更小的版本,例如 QwQ-32B,可以部署在本地設備上。此外,由于大量用戶期待我們的 App,我們将在發布正式版 QwQ-Max 的同時發布 Android 和 iOS APP。」
能不能重演 DeepSeek-R1 給 DeepSeek App 帶來的潑天流量不好說,但一個 Qwen 推理模型滿血版的到來,必然會加速阿裡巴巴在新時代的基本面探索,未必是電商,而是模型、雲計算、ToC 應用、電商等等都有新可能的基本面。
在此前不到一個月的時間裡,阿裡股價已經累計上漲了 60%,背後是當阿裡不再是被拼多多、抖音追趕的電商故事,所有人寄予厚望的新叙事—— AGI。
幾天前的财報電話會上,阿裡巴巴集團 CEO 吳泳銘首度宣布阿裡在新時代的野心,不遺餘力地追逐 AGI。2 月 24 日,他給出了 AGI 目标下的第一個計劃:未來三年,阿裡将投入超過 3800 億元,用于建設雲和 AI 硬體基礎設施,總額超過去十年總和。這筆中國民營企業在雲和 AI 硬體基礎設施建設領網域有史以來創紀錄的大規模投資,也在兌現阿裡的 AGI 夢想。
「Don't Teach,Incentize」這句話适用于模型推理能力的湧現,也适用這個新時代的新故事。Incentize 的一年,阿裡也需要找到自己的「豆包」「元寶」們。