数学 > 历史与概述
[提交于 2024年8月21日
]
标题: 基于人工智能的自动手写大学数学考试简答评分
标题: AI-assisted Automated Short Answer Grading of Handwritten University Level Mathematics Exams
摘要: 有效的和及时的教育评估反馈是必不可少的,但耗时且劳动密集,尤其是在复杂任务中。 自动化反馈系统最近的发展,从确定性回答评分到半开放和开放性作文的评估,得益于机器学习的进步。 预训练大型语言模型的出现,如GPT-4,为以最小的定制化高效处理多种回答类型提供了有前景的新机会。 本研究评估了预训练的GPT-4模型在大学水平数学考试中对半开放手写回答评分的有效性。 我们的研究结果表明,GPT-4提供的初始评分出人意料地可靠且成本效益高,但需要后续的人工验证。 未来的研究应专注于优化评分规则并提高手写回答的提取能力,以进一步利用这些技术。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.