今天小編分享的科學經驗:阿裏旗艦推理模型硬剛DeepSeek!官宣獨立APP,發布公告AI親自寫,歡迎閲讀。
阿裏通義 Qwen 團隊熬夜通宵,推理模型 Max 旗艦版來了!
QwQ-Max-Preview預覽版,已在 LiveCodeBench 編程測試中排名第 5,小超 o1 中檔推理和 DeepSeek-R1-Preview 預覽版。
△DeepSeek-R1 正式版未參加測試
在演示中,QwQ-Max-Preview 輕松搞定模拟海量小球運動的代碼。
而且這回,連發布公告都是 AI 自己寫的。
除了公告正文之外,發布公告還展示了模型思考的過程,下面劃重點了:
QwQ-Max-Preview 的基礎模型是 Qwen2.5-Max
擅長數學、編程、與 Agent 相關的任務
未來将以 Apache2.0 許可協定開源,也會有 32B 等本地部署版本
更猛的料還在後面,公告透露将發布Qwen Chat APP,很可能是獨立于通義千問 APP 的。
同一份公告的英文版也表示會有一個專門的 APP(We will launch a dedicated APP for Qwen Chat)。
Qwen 團隊官方推特賬号也的説法也驗證了,會有新的安卓和 iOS APP。
蘋果 App Store 效率榜,又要再添一員了。
除此之外,公告中還附有 8 段視頻,分别展示 QwQ-Max-Preview 在代碼、數學、搜索、Agent、創意寫作等方面的能力。
編程能力演示,也就是最近流行的彈跳小球物理模拟。
遊戲編程能力演示,把《俄羅斯方塊》和《2048 整合到一起》。
遊戲編程能力演示 2,做一個類似桌遊《卡坦島》的網頁版。
Agent 能力演示,給淘寶服裝店生成一張海報和二維碼。
Agent 能力演示(中文版),做一份杭州的 3 天旅行攻略。
數學能力演示," 用 0-9 構建三個數字 x、y、z,使得 x+y=z"。
創意寫作能力演示,寫一篇微型小説,網頁版 QwQ 自己的翻譯如下:
《夜行者》
城市永不眠,卻從未看見他。
他反復丈量七個街區,霓虹燈牌滲入他的影子。一盞閃爍的街燈嗡嗡低吟着他的名字——埃文——但字母在被聽見前就已消散。寫字樓的玻璃幕牆刺目地亮着,映照出他的透明。他将手掌貼在餐館的玻璃窗上,裏面的女招待正往咖啡杯續熱,目光始終未曾抬起。
凌晨 3:17,一只野貓駐足。刹那間,兩雙眼睛在暗處交匯。旋即它轉身逃竄,消失在小巷的噪點中。
某些夜晚他在數腳步聲。今夜卻闖入孩童的笑聲,清亮如星子墜地。轉身。陽台上有位穿睡衣的女孩正朝他揮舞手臂,懷裏緊抱着布絨貓頭鷹。母親将她拽入室内,窗扉轟然閉合。
晨光開始滲金。埃文滞留在斑馬線邊緣,影子被拉得細長,直到信号燈轉綠,世界再次向前滾動,将他遺落在原地。
又一次。
又一次。
又一次。
8. 聯網搜索能力演示,對哪吒 2 打破票房記錄寫一段 " 尖刻的贊揚 ",網頁版 QwQ 自己翻譯如下:
啊,《哪吒 2》——這部動畫巨作終于教會了好萊塢如何用人民币而非美元來計數。誰能想到,一部關于一個叛逆神明的電影,他有着火焰般的紅發和制造混亂的天賦,竟能将皮克斯的《頭腦特工隊 2》拉下馬,并衝進全球票房前十呢?那些長期以來認為中國動畫 " 古雅 " 或 " 模仿 " 的懷疑者們肯定沒想到。
讓我們驚嘆于這些數字:全球票房 10 億人民币,在北美創下中國電影的票房紀錄,其周邊商品的銷售速度甚至比主角逃脱天庭官僚的速度還要快。這幾乎是一種詩意的正義——當像迪士尼這樣的公司還在重復使用陳舊的公主套路時,《哪吒 2》卻利用其文化的獨特性,證明了觀眾渴望沉浸在本土神話的故事中,而不僅僅是另一個 " 被選中的人 " 的叙事。
當然,這其中的諷刺意味十足。這部在 2019 年曾被歸類為 " 國内奇觀 " 的電影,如今從湖南到好萊塢的影院中占據主導地位,讓評論家們忙于解釋一個 " 小城市 " 制作是如何勝過他們的大片算法。但别自欺欺人了——這不僅僅是對中國軟實力的勝利。這是對每一個曾説 " 動畫電影不能承載文化重量并打破記錄 " 的高管們的亮出的霓虹燈中指。
精彩,哪吒 2。你不僅重寫了票房規則,還将其付之一炬。現在,要是你的成功能燒掉這個行業殘留的自卑感就更好了。
現在可到網頁版 chat.qwen.ai 體驗 QwQ-Preview-Max,記得開啓左下角 " 深度思考 " 功能。
在線試玩:
https://chat.qwen.ai
參考鏈接:
[ 1 ] https://qwenlm.github.io/blog/qwq-max-preview/