揭秘首個AI數學大賽：為防止人類替考，AI“先交代”再交卷

今天小編分享的互聯網經驗：揭秘首個AI數學大賽：為防止人類替考，AI“先交代”再交卷，歡迎閱讀。

北京時間 4 月 15 日上午 8 點，2024 阿裡巴巴全球數學競賽預選賽正式交卷，58 個國家與地區的選手在線鏖戰 48 小時，更有來自全球知名高校院所與企業的 563 支隊伍使用 AI 作答，其中 00 後占比超 50%。他們各顯神通，使用模型調優、AI Agent、提示詞工程等多種方式，推動 AI 構建更強大的數學能力。

阿裡巴巴全球數學競賽組委會介紹，當前，AI 已經在不少領網域展現超越人類的能力，但在 " 人類智慧的皇冠 " 數學領網域還頗為受限。因此，從 2024 年起，阿裡巴巴全球數學競賽決定向 AI 開放，鼓勵探索 AI 的潛力上限，推動 AI 在數學領網域的研究和應用創新。

在這場 48 小時的預選賽中，AI 和人類選手共用一套試卷，題目包括選擇題、解答題與證明題。為了保證公平，防止 " 人類替考 "，組委會制定了 " 賽前固定方案、賽中誠實答題、賽後復現總結 " 的三步走規則。因此，在正式開考之前，AI 參賽團隊就需要完成模型的訓練或微調，并鎖定做題版本；如使用提示詞工程，也需要提前提交相應方案。

AI 挑戰賽吸引了全球 563 支隊伍踴躍報名，主要來自全球知名高校院所與企業，包括北大、清華、牛津、中國科學院、AWS、字節跳動等，大多具有 AI 專業背景，也有部分來自數學、物理等專業。統計顯示，參賽隊伍中，00 後占比超 50%，年輕一代正在成為 AI 生力軍，用多種形式熱情探索 AI 的數學上限。他們有的在開源大模型的基礎上進行專項微調，讓 AI 從初等數學進階到高等數學；他們有的構建起 AI Agent，結合提示詞工程來調用 GPT-4 等閉源模型，使得 GPT-4 的數學解題能力有大幅提升。

西南交通大學應用物理系的大四學生向勁宇是一名 AI 開發者，也是 MetaGPT-MC 小組貢獻者之一，這次他和多位開發者組隊參賽，使用 GPT-4 與 Claude 3 組成 Muti-Agent 的方案，讓 AI 分飾多個角色、相互驗證來完成答題步驟，改善了 AI" 一本正經的胡說八道 " 的通病，提升了 AI 做題的準确性。在 AWS 從事 AI 研究的毛帽，是數學專業的博士，已連續三年參賽，今年轉換身份，從人類選手轉為 AI 的競賽輔導員，與同事組成一支 " 豪華團隊 "，集合了數學、統計、地球物理及機器學習背景的 4 名博士，希望能向人類選手們秀一把 AI 的實力。

據介紹，本次 AI 挑戰賽結果将于 6 月與人類選手成績同期公布，AI 前三名分别獲得獎金 10000 美元、5000 美元、2000 美元。不少選手表示，他們更期待的是，AI 的成績能否達到人類優秀選手水平，能否達到決賽資格線？在往年的阿裡巴巴全球數學競賽中，只有 1% 的預選賽選手能夠晉級決賽。

由阿裡巴巴公益、達摩院共同舉辦的阿裡巴巴全球數學競賽，以不設報名門檻、趣味十足著稱，舉辦 6 屆以來不斷推陳出新，比如把螞蟻森林種樹、張師傅扭寬面等題目引入競賽，激發全民數學熱情。今年，這項賽事更是緊扣 AI 與數學融合的技術趨勢，首次向 AI 開放，不限選手是碳基還是矽基。（雷峰網）