今天小编分享的互联网经验:揭秘首个AI数学大赛:为防止人类替考,AI“先交代”再交卷,欢迎阅读。
北京时间 4 月 15 日上午 8 点,2024 阿里巴巴全球数学竞赛预选赛正式交卷,58 个国家与地区的选手在线鏖战 48 小时,更有来自全球知名高校院所与企业的 563 支队伍使用 AI 作答,其中 00 后占比超 50%。他们各显神通,使用模型调优、AI Agent、提示词工程等多种方式,推动 AI 构建更强大的数学能力。
阿里巴巴全球数学竞赛组委会介绍,当前,AI 已经在不少领網域展现超越人类的能力,但在 " 人类智慧的皇冠 " 数学领網域还颇为受限。因此,从 2024 年起,阿里巴巴全球数学竞赛决定向 AI 开放,鼓励探索 AI 的潜力上限,推动 AI 在数学领網域的研究和应用创新。
在这场 48 小时的预选赛中,AI 和人类选手共用一套试卷,题目包括选择题、解答题与证明题。为了保证公平,防止 " 人类替考 ",组委会制定了 " 赛前固定方案、赛中诚实答题、赛后复现总结 " 的三步走规则。因此,在正式开考之前,AI 参赛团队就需要完成模型的训练或微调,并锁定做题版本;如使用提示词工程,也需要提前提交相应方案。
AI 挑战赛吸引了全球 563 支队伍踊跃报名,主要来自全球知名高校院所与企业,包括北大、清华、牛津、中国科学院、AWS、字节跳动等,大多具有 AI 专业背景,也有部分来自数学、物理等专业。统计显示,参赛队伍中,00 后占比超 50%,年轻一代正在成为 AI 生力军,用多种形式热情探索 AI 的数学上限。他们有的在开源大模型的基础上进行专项微调,让 AI 从初等数学进阶到高等数学;他们有的构建起 AI Agent,结合提示词工程来调用 GPT-4 等闭源模型,使得 GPT-4 的数学解题能力有大幅提升。
西南交通大学应用物理系的大四学生向劲宇是一名 AI 开发者,也是 MetaGPT-MC 小组贡献者之一,这次他和多位开发者组队参赛,使用 GPT-4 与 Claude 3 组成 Muti-Agent 的方案,让 AI 分饰多个角色、相互验证来完成答题步骤,改善了 AI" 一本正经的胡说八道 " 的通病,提升了 AI 做题的准确性。在 AWS 从事 AI 研究的毛帽,是数学专业的博士,已连续三年参赛,今年转换身份,从人类选手转为 AI 的竞赛辅导员,与同事组成一支 " 豪华团队 ",集合了数学、统计、地球物理及机器学习背景的 4 名博士,希望能向人类选手们秀一把 AI 的实力。
据介绍,本次 AI 挑战赛结果将于 6 月与人类选手成绩同期公布,AI 前三名分别获得奖金 10000 美元、5000 美元、2000 美元。不少选手表示,他们更期待的是,AI 的成绩能否达到人类优秀选手水平,能否达到决赛资格线?在往年的阿里巴巴全球数学竞赛中,只有 1% 的预选赛选手能够晋级决赛。
由阿里巴巴公益、达摩院共同举办的阿里巴巴全球数学竞赛,以不设报名门槛、趣味十足著称,举办 6 届以来不断推陈出新,比如把蚂蚁森林种树、张师傅扭宽面等题目引入竞赛,激发全民数学热情。今年,这项赛事更是紧扣 AI 与数学融合的技术趋势,首次向 AI 开放,不限选手是碳基还是硅基。(雷峰网)