大意外！高考數學輪戰大模型，結果完全想不到 - 大酷樂

今天小編分享的科學經驗：大意外！高考數學輪戰大模型，結果完全想不到，歡迎閱讀。

聽說網友被 ChatGPT 氣炸了！

昨個兒高考數學剛結束，有網友就坐不住了，趕緊找來了新高考數學一卷的部分題喂給了 AI 同學。

結果卻讓人大跌眼鏡（8> √ 9 × 3=3 √ 3？）：

有網友表示：

ChatGPT4 能把自己氣炸，怎麼教都不會

△圖源博主 @浪豬灰頭

所以大模型之前表現數學推理能力好，都是在耍花招？它只是記住了問題的答案？

先别着急下定論，給 AI 同學一個證明自己的機會吧。

我們用 ChatGPT（GPT-3.5）、GPT-4、百度文心一言、阿裡通義千問、科大訊飛星火認知大模型這幾位 " 數學高手 " 進行了測試。（最近出現了太多的大模型，實在測不完，還有比如 Bard 不支持中文等原因，所以我們先選擇了上述幾個模型）

整體表現如上圖，目前大模型在做高考數學題方面還是個 " 差生 "。

一起來看下具體結果是怎樣令人哭笑不得的。

五大模型能否做對填空題？

先來點填空題當 " 開胃小菜 "。

公平起見，我們使用同樣的格式進行提問。

某學校開設了 4 門體育類選修課和 4 門藝術類選修課，學生需從這 8 門課中選修 2 門或 3 門課，并且每類選修課至少選修 1 門，則不同的選課方案共有？種

答案：64

GPT-4（正确）

ChatGPT （錯誤）

文心一言（錯誤）

不應該是兩種方案數加起來嗎？已經逐漸離譜。

通義千問（錯誤）

第一種選課方案裡的 " 都不選 " 是個什麼鬼！

訊飛星火（錯誤）

出師不利，只有 GPT-4 給出了正确答案，填空題對于大模型來說也很有難度？

但是看起來這幾位 AI 同學都知道分情況來計算，也許只是恰巧這道題做錯了？我們接着往下看。

在正四棱台 ABCD-A1B1C1D1 中，AB=2，A1B1=1，AA1= √ 2, 則該棱台的體積為

答案：7 √ 6/6

GPT-4 （錯誤）

ChatGPT（無解）

這一題直接全軍覆滅，ChatGPT 更是直接沒解出來，還讓檢查是不是題出錯了。【救命】

答案越來越離譜了，還真就不信邪了。

再來！

已知函數 f ( x ) = cos ω x -1 ( ω >0 ) 在區間 [ 0,2 π ] 有且僅有 3 個零點 , 則 ω 的取值範圍是？

答案： [ 2,3 )

GPT-4（錯誤）

ChatGPT（錯誤）

訊飛星火（正确）

本已經抱着再一次全軍覆沒的心情了，沒想到中文大模型力挽狂瀾！

做大題表現如何？

玩膩了填空題，再來挑戰一下更有難度的大題吧！

公平起見，我們還是以同樣的格式進行提問：

請你做一下面這道數學題：已知在△ ABC 中，A+B=3C，2sin ( A-C ) =sinB。（1）求 sinA （2）設 AB=5，求 AB 邊上的高

答案：（1）10 √ 10 /3（2）6

下面是各個大模型的表現結果：

訊飛星火（第一問答案正确，第二問錯誤）

這道三角函數題，科大訊飛的星火認知大模型第一小問答案對了，但是步驟中有差錯（第二步）。

據說，GPT-4 做這種題只有 0.1% 的概率生成的結果完全正确。

高考數學第一道大題通常都比較簡單，上面這幾位 AI 同學的表現你覺得怎麼樣？

如果大家感興趣可以自己測試一下後面幾道難度相對較高的大題（小編試過了，結果一言難盡，不忍直視）。

或者大家可以使用不同的 prompt 試試捏～

參考鏈接：

[ 1 ] https://weibo.com/5647310207/N4frlb5tx?refer_flag=1001030103_

熱門排行

比亞迪海洋網全新中型SUV“海獅06”諜照曝繁綺文 | 2025-04-15
一代歌後：承諾終身不改嫁，丈夫去世4年後生下郟君昊 | 2025-04-15
16日附加賽前瞻：勇士魔術被看好晉級庫裡有郜萌運 | 2025-04-15
奧地利陸軍裝備首批“夜戰士”突擊步槍價嬴覓晴 | 2025-04-15
“年輕人首台閱讀本”掌閱 iReader Light 4 嬴覓晴 | 2025-04-15
胡塞武裝麻煩大了？沙特出動7萬大軍，美軍擦邊嬴覓晴 | 2025-04-15
形勢逆轉，歐盟不許中國電動汽車賣太便宜了郜萌運 | 2025-04-15
「豁免」無效，關稅「橫跳」，蘋果和英偉達懸着郟君昊 | 2025-04-15
特斯拉車輛保險費用猛漲，漲幅超美國市場平均郜萌運 | 2025-04-15
雷軍時隔9天再發微博：感謝大家支持佼昌翰 | 2025-04-15
高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
曹操墓，裡面都有啥？衛青柏 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
解除資格！停止一切合作佼昌翰 | 2023-05-02
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
200戶連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容溫柔郜萌運 | 2023-05-02