今天小編分享的教育經驗:揭秘首個AI數學大賽:為防止人類替考,AI“先交代”再交卷,歡迎閲讀。
圖源:Pixabay
北京時間 4 月 15 日上午 8 點,2024 阿裏巴巴全球數學競賽預選賽正式交卷,58 個國家與地區的選手在線鏖戰 48 小時,更有來自全球知名高校院所與企業的 563 支隊伍使用 AI 作答,其中 00 後占比超 50%。
阿裏巴巴全球數學競賽組委會介紹,當前,AI 已經在不少領網域展現超越人類的能力,但在 " 人類智慧的皇冠 " 數學領網域還頗為受限。因此,從 2024 年起,阿裏巴巴全球數學競賽決定向 AI 開放,鼓勵探索 AI 的潛力上限,推動 AI 在數學領網域的研究和應用創新。
在這場 48 小時的預選賽中,AI 和人類選手共用一套試卷,題目包括選擇題、解答題與證明題。為了保證公平,防止 " 人類替考 ",組委會制定了 " 賽前固定方案、賽中誠實答題、賽後復現總結 " 的三步走規則。因此,在正式開考之前,AI 參賽團隊就需要完成模型的訓練或微調,并鎖定做題版本;如使用提示詞工程,也需要提前提交相應方案。
AI 挑戰賽吸引了全球 563 支隊伍踴躍報名,主要來自全球知名高校院所與企業,包括北大、清華、牛津、中國科學院、AWS、字節跳動等,大多具有 AI 專業背景,也有部分來自數學、物理等專業。
統計顯示,參賽隊伍中,00 後占比超 50%,年輕一代正在成為 AI 生力軍。他們有的在開源大模型的基礎上進行專項微調,讓 AI 從初等數學進階到高等數學;他們有的構建起 AI Agent,結合提示詞工程來調用 GPT-4 等閉源模型,使得 GPT-4 的數學解題能力有大幅提升。
西南交通大學應用物理系的大四學生向勁宇是一名 AI 開發者,也是 MetaGPT-MC 小組貢獻者之一,這次他和多位開發者組隊參賽,使用 GPT-4 與 Claude 3 組成 Multi-Agent 的方案,讓 AI 分飾多個角色、相互驗證來完成答題步驟,改善了 AI" 一本正經的胡説八道 " 的通病,提升了 AI 做題的準确性。在 AWS 從事 AI 研究的毛帽,是數學專業的博士,已連續三年參賽,今年轉換身份,從人類選手轉為 AI 的競賽輔導員,與同事組成一支 " 豪華團隊 ",集合了數學、統計、地球物理及機器學習背景的 4 名博士,希望能向人類選手們秀一把 AI 的實力。
據介紹,本次 AI 挑戰賽結果将于 6 月與人類選手成績同期公布,AI 前三名分别獲得獎金 10000 美元、5000 美元、2000 美元。不少選手表示,他們更期待的是,AI 的成績能否達到人類優秀選手水平,能否達到決賽資格線?在往年的阿裏巴巴全球數學競賽中,只有 1% 的預選賽選手能夠晉級決賽。
由阿裏巴巴公益、達摩院共同舉辦的阿裏巴巴全球數學競賽,截至目前共舉辦 6 屆。今年,這項賽事緊扣 AI 與數學融合的技術趨勢,首次向 AI 開放,不限選手是碳基還是硅基。