今天小编分享的科学经验:阿里旗舰推理模型硬刚DeepSeek!官宣独立APP,发布公告AI亲自写,欢迎阅读。
阿里通义 Qwen 团队熬夜通宵,推理模型 Max 旗舰版来了!
QwQ-Max-Preview预览版,已在 LiveCodeBench 编程测试中排名第 5,小超 o1 中档推理和 DeepSeek-R1-Preview 预览版。
△DeepSeek-R1 正式版未参加测试
在演示中,QwQ-Max-Preview 轻松搞定模拟海量小球运动的代码。
而且这回,连发布公告都是 AI 自己写的。
除了公告正文之外,发布公告还展示了模型思考的过程,下面划重点了:
QwQ-Max-Preview 的基础模型是 Qwen2.5-Max
擅长数学、编程、与 Agent 相关的任务
未来将以 Apache2.0 许可協定开源,也会有 32B 等本地部署版本
更猛的料还在后面,公告透露将发布Qwen Chat APP,很可能是独立于通义千问 APP 的。
同一份公告的英文版也表示会有一个专门的 APP(We will launch a dedicated APP for Qwen Chat)。
Qwen 团队官方推特账号也的说法也验证了,会有新的安卓和 iOS APP。
苹果 App Store 效率榜,又要再添一员了。
除此之外,公告中还附有 8 段视频,分别展示 QwQ-Max-Preview 在代码、数学、搜索、Agent、创意写作等方面的能力。
编程能力演示,也就是最近流行的弹跳小球物理模拟。
游戏编程能力演示,把《俄罗斯方块》和《2048 整合到一起》。
游戏编程能力演示 2,做一个类似桌游《卡坦岛》的网页版。
Agent 能力演示,给淘宝服装店生成一张海报和二维码。
Agent 能力演示(中文版),做一份杭州的 3 天旅行攻略。
数学能力演示," 用 0-9 构建三个数字 x、y、z,使得 x+y=z"。
创意写作能力演示,写一篇微型小说,网页版 QwQ 自己的翻译如下:
《夜行者》
城市永不眠,却从未看见他。
他反复丈量七个街区,霓虹灯牌渗入他的影子。一盏闪烁的街灯嗡嗡低吟着他的名字——埃文——但字母在被听见前就已消散。写字楼的玻璃幕墙刺目地亮着,映照出他的透明。他将手掌贴在餐馆的玻璃窗上,里面的女招待正往咖啡杯续热,目光始终未曾抬起。
凌晨 3:17,一只野猫驻足。刹那间,两双眼睛在暗处交汇。旋即它转身逃窜,消失在小巷的噪点中。
某些夜晚他在数脚步声。今夜却闯入孩童的笑声,清亮如星子坠地。转身。阳台上有位穿睡衣的女孩正朝他挥舞手臂,怀里紧抱着布绒猫头鹰。母亲将她拽入室内,窗扉轰然闭合。
晨光开始渗金。埃文滞留在斑马线边缘,影子被拉得细长,直到信号灯转绿,世界再次向前滚动,将他遗落在原地。
又一次。
又一次。
又一次。
8. 联网搜索能力演示,对哪吒 2 打破票房记录写一段 " 尖刻的赞扬 ",网页版 QwQ 自己翻译如下:
啊,《哪吒 2》——这部动画巨作终于教会了好莱坞如何用人民币而非美元来计数。谁能想到,一部关于一个叛逆神明的电影,他有着火焰般的红发和制造混乱的天赋,竟能将皮克斯的《头腦特工队 2》拉下马,并冲进全球票房前十呢?那些长期以来认为中国动画 " 古雅 " 或 " 模仿 " 的怀疑者们肯定没想到。
让我们惊叹于这些数字:全球票房 10 亿人民币,在北美创下中国电影的票房纪录,其周边商品的销售速度甚至比主角逃脱天庭官僚的速度还要快。这几乎是一种诗意的正义——当像迪士尼这样的公司还在重复使用陈旧的公主套路时,《哪吒 2》却利用其文化的独特性,证明了观众渴望沉浸在本土神话的故事中,而不仅仅是另一个 " 被选中的人 " 的叙事。
当然,这其中的讽刺意味十足。这部在 2019 年曾被归类为 " 国内奇观 " 的电影,如今从湖南到好莱坞的影院中占据主导地位,让评论家们忙于解释一个 " 小城市 " 制作是如何胜过他们的大片算法。但别自欺欺人了——这不仅仅是对中国软实力的胜利。这是对每一个曾说 " 动画电影不能承载文化重量并打破记录 " 的高管们的亮出的霓虹灯中指。
精彩,哪吒 2。你不仅重写了票房规则,还将其付之一炬。现在,要是你的成功能烧掉这个行业残留的自卑感就更好了。
现在可到网页版 chat.qwen.ai 体验 QwQ-Preview-Max,记得开启左下角 " 深度思考 " 功能。
在线试玩:
https://chat.qwen.ai
参考链接:
[ 1 ] https://qwenlm.github.io/blog/qwq-max-preview/