DeepSeek逼出谷歌新推理模型：40分優勢超GPT4.5登頂競技場，支持原生多模态，但依然敗給了“竹竿問題” - 大酷樂

今天小編分享的科學經驗：DeepSeek逼出谷歌新推理模型：40分優勢超GPT4.5登頂競技場，支持原生多模态，但依然敗給了“竹竿問題”，歡迎閲讀。

又雙叒，搶在 OpenAI 直播之前，谷歌 Gemini 2.5 系列來了。

首個版本 Pro Experimental 一登場就搶下大模型競技場第一名，并且整整比 GPT-4.5 高出 40 分！

Gemini 2.5 同樣是推理模型，用 Jeff Dean 的説法是：

這是我們最智能的模型，具有令人印象深刻的高級推理和編碼能力。

Be like，給出一段提示詞：

幫我制作一款吸引人的無盡跑酷遊戲。螢幕上要有關鍵操作説明。使用 p5js，不要用 HTML。我喜歡像素風格的恐龍和有趣的背景。

1 分鍾左右，就能得到：

谷歌介紹，相較于 Gemini 2.0 Flash Thinking 這個谷歌首個推理模型，Gemini 2.5 在基礎模型和後訓練技術上都有改進。

不僅是在大模型競技場上一舉拿下高分，在各種推理、數學、科學、編程基準上，Gemini 2.5 Pro 都表現出色，屬于是編程能跟 Claude 3.7 Sonnet 掰手腕，數學能跟 Grok 3 相媲美。

更詳細測試結果看這裏：

Gemini 2.5 Pro 的上下文視窗是 1M tokens，并且支持原生多模态：可以理解龐大數據集并處理來自不同信息源的復雜問題，包括文本、音頻、影像、視頻，甚至是整個代碼庫。

在推理能力之外，谷歌官方還強調了一把 Gemini 2.5 Pro 的編程性能：

2.5 pro 擅長創造視覺上引人注目的 Web 應用程式和智能體代碼。

谷歌 DeepMind 研究員們也釋出了更多案例，比如把 " 六邊形内旋轉小球 " 這事整得更加酷炫：

Jeff Dean 則興奮地放出了一個編程 + 數學的用例，還説：

我記起了小時候第一次了解到曼德布羅特集時的興奮之情。

（曼德布羅特集：一種在復平面上形成的分形集合）

p.s. 距離谷歌上新 Gemini 2.0 家族，也不過一個多月時間，怕不是讓 DeepSeek 給逼急了（doge）。

目前，Gemini 2.5 Pro 已經面向 Gemini Advanced 付費用户開放，開放人員也可以在 Google AI Studio 中試用。谷歌表示，未來幾周内還将在 Vertex AI 上推出該模型。

不過，當我們拿最新大模型難題" 竹竿問題 "測試 Gemini 2.5 Pro 時，它并沒能順利通關。

試玩地址：

http://aistudio.google.com/app/prompts/new_chat?model=gemini-2.5-pro-exp-03-25

參考鏈接：

https://blog.google/technology/google-deepmind/gemini-model-thinking-updates-march-2025

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法！

— 完 —

最後一周！2025 年值得關注的 AIGC 企業產品報名即将截止

下一個 AI" 國產之光 " 将會是誰？歡迎申報獎項！

本次評選結果将于 4 月 16 日中國 AIGC 產業峰會上公布。

一鍵星标

科技前沿進展每日見

熱門排行

王治郅：楊瀚森主要的問題是速度他的速度跟郟君昊 | 2025-05-05
貿易戰燒進電影院：特朗普拟重税打擊外國電影習又夏 | 2025-05-05
貸款追高炒黃金的人後悔了！有人一天虧掉6年寸飛蘭 | 2025-05-05
手機電池突破8000mAh？硅碳技術的回旋镖：「折衛青柏 | 2025-05-05
貸款追高炒黃金的人後悔了！有人一天虧掉6年繁綺文 | 2025-05-05
任天堂對Genki提起Switch 2商标侵權訴訟，後郜萌運 | 2025-05-05
哪吒汽車APP和官網恢復正常知情人士：之前斷袁曼雁 | 2025-05-05
極越汽車 CEO 夏一平名下青島/義烏兩家公司集玲琳 | 2025-05-05
全國經濟第一大省明确，推動組建農商聯合銀行佼昌翰 | 2025-05-05
桑保利：亞馬爾有配合意識&有點像梅西姆巴佩甄正浩 | 2025-05-05
高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
曹操墓，裏面都有啥？衛青柏 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
解除資格！停止一切合作佼昌翰 | 2023-05-02
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
200户連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容温柔郜萌運 | 2023-05-02