大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

Qwen3真香!通義App滿血接入,一手實測在此

2025-05-01 简体 HK SG TW

今天小編分享的科學經驗:Qwen3真香!通義App滿血接入,一手實測在此,歡迎閱讀。

開源大模型新王者,正在受到空前關注。

Qwen3 預告一出,直接開啟不眠夜模式。

△來自編輯部本部

等到深夜正式上線并宣布登頂全球最強開源模型,更是瞬間引爆全網熱議。

網友們的反應在 meme 中盡數體現(doge)。

畢竟,單看紙面參數,Qwen3 就是個妥妥的大工程:

8 款混合推理模型全部開源,參數量從0.6B到235B全面覆蓋;

32B 模型就有超越 OpenAI o1、DeepSeek R1 的性能表現,在編程基準測評中還超過了風頭正盛的 Gemini 2.5 Pro;

支持思考和非思考模式,支持 119 種語言和方言、加強對 MCP 支持……

還有網友認為,這是 " 又一個 DeepSeek 時刻 "。

這一次模型開源,通義 App 和網頁版也趕在第一時間滿血上線 Qwen3,并且有專屬智能體體驗。

新王究竟表現如何,我們第一時間深度實測,以見真章。

Qwen3 住進 App,還能這樣玩兒

打開通義 App/ 通義網頁版首頁,目前有兩種方式可以體驗到 Qwen3 模型:

直接用輸入框對話(代碼 / 數學 / 翻譯類問題默認調用 Qwen3-235B,其它問題不調用 Qwen3)

選用 " 千問大模型 " 智能體(默認使用旗艦版 Qwen3-235B-A22B)

BTW,通義網頁版近期上線了新網域名 tongyi.com,不要走錯。

OK,接下來進入正題。

官方強調了新模型在 Agent、編碼方面的能力提升,還增強了對 MCP 的支持。具體表現如何,我們直接在通義 App裡全方位實測。

第一關:代碼生成

先來個新模型 " 入門挑戰 " ——空間内彈小球。

這個經典測試在考驗模型代碼能力的同時,還重點關注了它對物理世界的理解,幾乎每一個新模型都會被拉出來遛一遛。

提示詞如下(p5.js 腳本、25 個粒子、圓柱形容器):

而第一次接受挑戰的旗艦版 Qwen3 模型,用時 1 分鍾,唰唰唰就生成了一百多行代碼:

将上述代碼實際運行一下,結果 be like:

雖然一眼看去沒有 " 小球直接衝出圓圈 " 這樣明顯的錯誤,但也确實缺少 3D 空間感。

作為對比,我們拉出官方測評圖中,和滿血 Qwen3 代碼實力最相近的 Grok 3 模型。

重復相同操作,讓 Grok 3 基于同一提示詞生成代碼,并實際運行:

二者的區别相當明顯,後者(Grok 3)的空間感肉眼可見更強。

為了進一步探究兩段代碼的差别,我們又直接讓 Qwen3" 自己找找差距 "(doge)。

結果,它真的很認真地進行了全方位對比,包括渲染模式、容器結構、粒子運動與碰撞測試等等。

最終結論也用表格進行了呈現,一目了然:

甚至,基于它提出的改進意見,我們繼續讓它出了一個新版本。

實際運行後,這次的結果已經非常符合我們的要求了。

事實上,深扒 Qwen3 的思考過程,我們才發現原來第一版的 2D 效果是它 " 深思熟慮 " 後的選擇。

這裡主要考慮到了兼容性問題,所以簡化成了俯視圖來呈現。

從上面這個簡單測試,我們已經能夠窺見 Qwen3 的程式員素養确實不錯。

接下來難度更新,直接讓它幫打工人設計一個提醒喝水的電腦端 App。

注意,為了能快速在浏覽器端預覽生成效果,這裡我們采用了 " 極簡模式 ",僅保留最基礎的功能,不涉及使用任何第三方庫。

結果生成的 App 有模有樣,還能真實點擊互動。

一旦讓具備工程能力的童鞋們上手,估計能實現更多復雜效果。

第二關:邏輯推理

接下來我們考查一下 Qwen3 的邏輯推理能力。

老規矩,先上一道經典邏輯陷阱題:

農夫要把一頭狼、一只羊和一盆菜帶過一條河。河邊只有一艘小船,農夫每次只能帶一樣東西過河。如果農夫不在場時,狼會吃羊,羊會吃菜。如何安排農夫的安全過河方案?

在故意關閉聯網模式後,Qwen3 經過一步步推理最終給出了正确答案。

農夫應按照以下順序操作:

帶羊過河,返回。

帶狼過河,帶回羊。

帶白菜過河,返回。

帶羊過河。

此方案通過 7 次移動(4 次過河,3 次返回),确保所有物品安全抵達對岸。

而且從 Qwen3 的思考過程能夠看到,其思維方式和人類一樣,是通過不斷推翻各種方案來找出可行路徑。

再來一道超高難度專業數學題。

原題來自今年的普特南數學競賽,該競賽号稱最難本科數學考試,人類要考 6 小時,并且所選取的題目據稱前 500 名選手均未能完整作答。

而扔給 Qwen3 後,可以看到整體的思考時間确實明顯變長,最終用時5 分 38 秒給出了正确答案。

p.s. 千問智能體無法直接上傳圖片,最終選擇從 App 首頁上傳圖片,提取文字後繼續使用千問智能體作答。

更有趣的是,扒一扒其思考過程,還能看到模型在線表演 " 崩潰 ":

當然,雖然 AI 的解讀速度和正确率明顯勝于人類,但還是要和同類來比。

在國外網友的測試中,同一道題 Grok 3(Think)在約 8 分鍾内找到了解決方案。

所以對比下來,這一局算 Qwen3 略勝一籌。

第三關:多語言能力

另外據介紹,Qwen3 的一大亮點是支持 119 種語言和方言,被網友戲稱 "AI 屆多鄰國 "(doge)。

别的不說,直接讓它來挑戰一把國内專業譯者的地位試試。

将莎士比亞《哈姆雷特》的經典選段丢給它,讓它按照 " 信達雅 " 翻譯成中文。

它還知道參考優秀譯本,并且注意避免直接抄襲造成侵權。

最終生成的結果如下(左側),對比我們熟知的朱生豪經典譯本(右側),你覺得 AI 味兒濃度如何?

第四關:賽博閨蜜、shopping 比價、寫歌一網打盡

除了以上更側重模型基礎能力的考查,當 Qwen3 被塞進 App 後,我們還解鎖了更多玩法。

做旅遊規劃這種就不必多說了,關鍵還能充當 " 賽博閨蜜 ",幫忙選擇更适合發朋友圈的遊客照。

日常也能用來購物比價,比如分析出當下最值得入手的 3000 元預算内平板。

不僅用表格清晰列出了各品牌的核心參數,還按照不同需求進行了推薦,一整個造福伸手黨。

此外,最近火上熱搜的 "AI 寫歌 ",我們也用 Qwen3 嘗試了一把。

五一版 · 大張偉嗨歌這就新鮮出爐,光看歌詞确實有内味兒了:

Okk,以上為我們的全部實測。

小結一下,通過在通義 App 使用 Qwen3 專屬智能體,我們能明顯感受到以下幾點:

Qwen3 旗艦模型的生成速度非常快,體驗很絲滑;

模型擅長推理,能夠解決經典邏輯陷阱和復雜數學題;

代碼能力方面,已經能夠快速實現一些簡單需求;

由于載體是 App,可拓展的玩法很多。

而且,通義 App 自上個月頁面改版後,整體設計更簡潔,互動也更加完善了。

更多網友實測

與此同時,随着 Qwen3 模型的爆火,更多網友也第一時間進行了試玩。

有和 " 空間内彈小球 " 類似效果的頁面設計:

還有用阿拉伯語、法語和印地語解釋愛因斯坦相對論的玩法,該博主聲稱:

簡單到連十歲的小孩都能理解。

當然,大家一直尤為鍾愛的小遊戲開發也安排上了:

開源界的新王者

Qwen3 引發熱議背後,可以看到的是,在開源影響力上,以 Qwen 為代表的國產大模型,已經有超越 Llama 之勢。

這一點,從 reddit LocalLLaMA 等開發者聚集的板塊的最新話題中,亦可見一斑。

不僅是基準評測數據的紙面超越,實測越多,模型實力究竟幾何就越能被客觀公允地認知。

而如今的開源格局之變,并非一蹴而就。前有 DeepSeek,今有 Qwen3,背後體現的是來自中國的開源力量一以貫之的努力,和一如既往的" 中國速度 "。

以 Qwen 為例:

2024 年 11 月底,開源推理模型 QwQ;

2025 年春節檔,連發 Qwen2.5 百萬上下文版本、視覺理解模型 Qwen2.5-VL,還有超大規模 MoE 模型 Qwen-2.5 Max;

2025 年 3 月,QwQ-32B 以 1/10 成本比肩 DeepSeek-R1;

多模态方面,還有萬相 Wan 的持續開源和迭代……

這還只是短短 5 個月内的進展。

再加上更加開放和商用友好的 Apache 2.0 協定,開發者們的轉向,自然在情理之中。

作為普通用戶,一方面,可以在通義 App 這樣的官方應用上更快感知到滿血模型的能力。

另一方面,也可以期待開源,帶來更多衍生應用的可能性。

那麼,再次打開傳送門:

tongyi.com

如果你探索到了什麼新鮮玩法,也歡迎在評論區跟大家分享 ~

參考鏈接:

[ 1 ] https://x.com/YUEXINWANG61157/status/1917059240360919318

[ 2 ] https://x.com/kis/status/1917090589931409750

[ 3 ] https://x.com/godofprompt/status/1917147674438255021

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—  完  —

點亮星标

科技前沿進展每日見

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們