大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

MathGPT来了!专攻数学大模型,解题讲题两手抓

2023-05-08 简体 HK SG TW

今天小编分享的科学经验:MathGPT来了!专攻数学大模型,解题讲题两手抓,欢迎阅读。

大模型领網域又来新玩家。

据了解,学而思正在进行自研数学大模型的研发,命名为MathGPT。

面向全球数学爱好者和科研机构,以数学领網域的解题和讲题算法为核心。

目前已经取得阶段性成果,并将于年内推出基于该自研大模型的产品级应用。

据悉,学而思已将 MathGPT 作为公司核心项目,由CTO 田密负责。

今年春节前,该项目已经启动相应的团队建设、数据、算力准备和技术研发。

此外,学而思已经启动在美国硅谷的团队建设,将成立一支海外算法和工程团队,在全球范围内招募优秀的人工智能专家加入。

MathGPT 与大语言模型(LLM)的差异

OpenAI 在今年三月份发布了大语言模型 GPT-4,国内百度、阿里也发布了各自的大模型产品,但通用语言模型更像一个 " 文科生 ",在语言翻译、摘要、理解和生成等任务上有出色表现,在数学问题的解决、讲解、问答和推荐方面则存在明显不足:

解答数学问题经常出错,有些数学问题虽然能够解决,但方法更偏成年人,无法针对适龄孩子的知识结构和认知水平做适配。

" 这种不足是由 LLM 模型的自身特点决定的。"

学而思 AI 团队负责人介绍,LLM 大模型来自对海量语言文本的训练,因此最擅长语言处理。

行业内偏向基于 LLM 大模型做阅读、写作类应用,但如果想要在数学能力上有突破,就需要研发新的大模型。

因此,学而思决心组建团队专研 MathGPT ——数学领網域大模型,用自己在数学和 AI 上的多年积累,面向全球范围内的数学爱好者和科研机构,做好 AI 大模型时代的数学基础工作。

学而思希望通过 MathGPT 弥补和攻克大语言模型的三个问题:

第一,题目要解对,现在 GPT 结果经常出现错误;

第二,解题步骤要稳定、清晰,现在 GPT 的解题步骤每次都不一样,而且生成内容经常很冗余;

第三,解题要讲的有趣、个性化,现在 GPT 的解释过于 " 学术 " 和机械,对孩子的学习体验很不友好。

为了实现这些目标,MathGPT 将结合大语言模型和计算引擎两者的能力,大语言模型负责理解题目、分步解析,并在合适的步骤自行调用计算引擎,这样能提高题目解答正确率。

基于海量名师解题过程的数据进行模型训练,模型的解题步骤可以更加清晰。

再引入优秀老师的教学理念和方法,模型在解题趣味性上也能进一步提高。

据透露,MathGPT 将先从中小学数学做起,逐步覆盖全年龄学段和解题种类。

做 MathGPT,学而思凭什么

学而思作为获国家科技部批准的 " 智慧教育国家新一代人工智能开放创新平台 " 建设部門,也是教育行业唯一一家人工智能 " 国家队 " 成员,在人工智能领網域有着多年的深入研究。

早在 2017 年,学而思便成立了 AI lab 人工智能实验室。

据公开信息显示,基于智慧教育人工智能开放创新平台助力,学而思 AI lab 获得各类顶级学术会议比赛冠军 16 项,亚军 6 项;

发表国际期刊和会议高水平学术论文 31 篇,包含光学字元识别、影像、自然语言处理、语音以及多模态等多领網域的学术研究,在计算机视觉顶会以及自然语言顶会中均有多篇论文发表;

申请专利 220 余项,授权专利 150 余项,軟體著作权 60 余项。

△学而思 AI lab 在各类顶级学术会议比赛获奖情况

" 以数学起家 " 的学而思至今已有 20 年的数学教学经验,积累了庞大的数学相关数据,这些数据是进行 MathGPT 训练的必备物料。

另外,学而思的海外业务 Think Academy 在全球若干国家和地区深受数学爱好者喜欢,学而思的学生在每年的 IMO 和 AMC 等国际数学竞赛中表现优异,每年都有多位学生在国际奥林匹克数学竞赛中拿到金牌。

所以,学而思选择在 MathGPT 方向发力也顺理成章。

今年 2 月,学而思学习机上线 AI 讲题机器人小 π。

据了解,小 π 研发已有数年积累,研发方向主要为数学等领網域的 AI 智能讲题能力,核心优势在于数理逻辑和运算。

在实测中,当学而思学习机用户配套的 AR 镜识别到一道手写或者印刷的数学计算题时,小 π 机器人会对题目进行智能 AI 拆解分析,同时生成逻辑流畅、表达清晰的语言,将题目的解题方法讲解出来。

该功能已覆盖的题目包括分数、小数等复杂计算,甚至一些 " 凑数、组合 " 的巧妙算法,已十分接近真人老师的解题效果。

△同一道数学题目在 ChatGPT ( 上 ) 和小 π(下)的解答对比

小 π 相关技术于 2020 年启动研发,以学而思超 3 亿的专业题库数据作为基础,经过了 3 年的数据训练和打磨迭代。

另据了解,学而思学习机近期将会上线一款 "AI 助手 ",涵盖作文助手、口语助手、阅读助手、数学助手等相关功能,该 AI 产品将于 5 月 11 日开启内测。

MathGPT 的挑战和技术难题

如何利用大语言模型服务各行各业是当下社会的焦点问题。

大模型的出现是对生产力和生产关系的改变,各行各业都会受到影响,并会在大模型的助力下完成转型更新。

教育行业和大模型有着天然的契合点。教育也是通过交流,把知识和信息传递给学生,大模型会让教育行业的数字化、智能化速度更快。

比如在教育领網域,Duolingo、Quizlet、可汗学院等产品主要和 OpenAI 合作,在 GPT 大模型上做微调和接口调用,增强原有的产品体验。

但也有一些领網域如数学、医学等,对 AI 的需求是准确、清晰、具备强大的逻辑推理能力,且容错率低,通用 LLM 目前的性能表现还无法在上述领網域取得突破,未来是否可能取得突破尚不清晰。

以数学领網域为例,目前市场上有几个主要流派。

比如 Google 收购的 Photomath、微软数学、Mathway、专注数学计算的 WolframAlpha 等产品,主要利用非 LLM 的传统 AI 技术加上数据库的方式解决数学问题。

走 AGI 路线的公司则尝试让通用 LLM" 更懂数学 ",比如 GPT4 在数学任务上比之前的 3.5 版本性能更好,谷歌旗下的 Minerva 模型也专门针对数学问题进行调优。

学而思选择了另一条少有人走的路,不基于现有 LLM 做微调和接口调用、不做通用 LLM,而是自研基于专业领網域的 " 数学大模型 "MathGPT,致力于打造自主、稳定、可持续、高质量的学习解决方案。

学而思表示,乔布斯对电腦的定义是 " 思维的自行车 ",MathGPT 面向全球的数学爱好者,希望能成为学习数学、思考数学的 " 自行车 ",帮助人们更好的解决学习数学、思考数学的问题。

长远看来,数学思维代表着理性逻辑,是 " 思维的体操 ",是一种基础能力,能够与很多行业产生关联。

未来,也许每个人都是程式员,用自然语言就可以编程,创新想法,与人协作,创造新事物,但是用自然语言编程的好坏很大程度取决于是否经过数学思维的训练。我们希望通过 MathGPT,帮助每个人更好地建立理性逻辑,从而终身成长,推动社会进步。

在大语言模型不断进化的浪潮下,不同的技术路线选择孰优孰劣,仍有待讨论和验证。

学而思自研独立的 MathGPT 大模型是否成立,是否能够超越通用模型在数学任务上的表现,是否更匹配不同人群的数学学习场景,这个问题还需要在创新实践中寻找答案。

随着整个行业的深化发展和越来越多人才参与到这个领網域,相信不久的将来就能看到更为成熟的解决方案。

* 本文系量子位获授权刊载,观点仅为作者所有。

—  完  —

量子位  QbitAI

վ ' ᴗ ' ի 追踪 AI 技术和产品新动态

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~  

>
熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們