8月24日,好未来CTO田密宣布好未来自研的数学领域千亿级大模型MathGPT开启内测。
今年5月,好未来曾公布正在进行自研数学大模型的研发,命名为MathGPT。据介绍,MathGPT是面向全球数学爱好者和科研机构,以解题和讲题算法为核心的数学垂直领域的大模型,也是国内首个专为数学打造的大模型。
用户使用MathGPT时,用文字或图片方式上传数学题,即可得到对话式的解答反馈,也可以通过“随机来一题”的按钮,随机生成数学题目并由系统给出解答。目前,MathGPT支持中文、英文版本的PC端和移动端体验。
田密介绍,MathGPT汇集了好未来多年教育教研数据积累,专注于数学领域。通过优质教育数据,实现题目计算、讲解、问答等多任务持续训练和有监督微调,呈现出卓越表现。
MathGPT官网显示,MathGPT的数学计算能力已覆盖小学、初中、高中的数学题,题目类型涵盖计算题、应用题、代数题等多个类型,还可以针对题目进行追问,暂未开放数学之外的问答互动。
MathGPT技术报告显示,在CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考数学和Math401等6个公开数学评测集合的测试结果中,好未来的MathGPT取得了多项测试的最高分数。同时,MathGPT在C-Eval的初高中的全科测试集合上也均有不错的表现。
在解题稳定性、讲解友好度方面,MathGPT基于海量名师解题过程的数据进行模型训练,模型的解题步骤专业清晰。
以一道数列题为例,MathGPT给出的含“分析”、“详解”、“点睛”三个部分,比通用大模型的粗略讲解方式更为细致,“分析”提供了题目的解题思路、思考方式,帮助用户更好地理解题目,“详解”则给出具体的计算方式和答案,最后“点睛”的环节,对题目的考点、难点、关键点进行提示,帮助用户回顾反思出题意图、举一反三。
对于使用者而言,研究数学问题不仅在于得到答案本身,更在于答案背后的解题原理、思路逻辑。与其他通用大模型相比,MathGPT能实现更高准确度的解题,也能把答案解析得更清楚、讲解得更明白,更好地满足用户使用AI产品解答数学问题的核心需求。
在MathGPT发布同时,好未来也在官网更新了一个具有代表性和挑战性的数学任务评测集,供全球人工智能专家、数学爱好者体验和测评。
随着大语言模型的兴起,如何用AI技术服务各行各业是社会关注的焦点。“AI带来了重新定义教育行业的机会,大模型技术使得大规模的因材施教真正有了实现的可能。”田密认为,大模型的本质,是一种更高效的、从数据中学习知识并加以应用的方式。在AI能力的加持下,“学生自学+AI答疑”的新型学习方式成为广泛的可能。学习者获得优质教学内容的门槛、成本降低,获得的教学内容个性化、精细化程度持续升高,可以实现千人千面的AI教学和答疑辅导,每个学生都能得到最适合自己的学习内容。
据田密介绍,随着内测的顺利进行,MathGPT的解题能力将得到持续提升,基于MathGPT的产品级应用也正在加速研发中,将于近期发布。