Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2306.04190

帮助 | 高级搜索

计算机科学 > 计算与语言

arXiv:2306.04190 (cs)
[提交于 2023年6月7日 ]

标题: 基于语音识别的阅读教学辅导系统:如何优化对一年级学生的反馈

标题: An ASR-Based Tutor for Learning to Read: How to Optimize Feedback to First Graders

Authors:Yu Bai, Cristian Tejedor-Garcia, Ferdy Hubers, Catia Cucchiarini, Helmer Strik
摘要: 近年来,将自动语音识别(ASR)应用于阅读练习应用的兴趣正在增长。 在以前的研究中,我们介绍了一种基于ASR的荷兰阅读导师应用程序,该程序旨在为正在学习阅读的一年级学生提供即时反馈。 我们发现 在阅读过程的这一阶段,ASR具有潜力,因为结果表明,学生通过使用软件在阅读准确性和流利度方面取得了进步。 在当前的研究中,我们使用了一个现有语料库(JASMIN)中的儿童语音来开发两个新的ASR系统,并将结果与之前的研究结果进行了比较。 我们通过Cohen's Kappa、Matthews相关系数(MCC)、精确率、召回率和F度量等评估指标,使用人工转录文本在单词级别上分析了ASR系统的正确/错误分类。 我们观察到,新开发的ASR系统在与基于人类的判断的一致性以及正确拒绝(CR)方面有所改善。 ASR系统的准确性因不同的阅读任务和单词类型而异。 我们的结果表明,在当前配置下,对孤立单词进行分类是困难的。 我们讨论了这些结果,改进我们系统的可能方法以及未来研究的方向。
摘要: The interest in employing automatic speech recognition (ASR) in applications for reading practice has been growing in recent years. In a previous study, we presented an ASR-based Dutch reading tutor application that was developed to provide instantaneous feedback to first-graders learning to read. We saw that ASR has potential at this stage of the reading process, as the results suggested that pupils made progress in reading accuracy and fluency by using the software. In the current study, we used children's speech from an existing corpus (JASMIN) to develop two new ASR systems, and compared the results to those of the previous study. We analyze correct/incorrect classification of the ASR systems using human transcripts at word level, by means of evaluation measures such as Cohen's Kappa, Matthews Correlation Coefficient (MCC), precision, recall and F-measures. We observe improvements for the newly developed ASR systems regarding the agreement with human-based judgment and correct rejection (CR). The accuracy of the ASR systems varies for different reading tasks and word types. Our results suggest that, in the current configuration, it is difficult to classify isolated words. We discuss these results, possible ways to improve our systems and avenues for future research.
评论: 已发表(双盲同行评审)于SPECOM 2021
主题: 计算与语言 (cs.CL) ; 机器学习 (cs.LG); 声音 (cs.SD); 音频与语音处理 (eess.AS); 信号处理 (eess.SP)
引用方式: arXiv:2306.04190 [cs.CL]
  (或者 arXiv:2306.04190v1 [cs.CL] 对于此版本)
  https://doi.org/10.48550/arXiv.2306.04190
通过 DataCite 发表的 arXiv DOI
期刊参考: In: Karpov A., Potapova R. (eds) Speech and Computer. SPECOM 2021. Lecture Notes in Computer Science, vol 12997. Springer, Cham
相关 DOI: https://doi.org/10.1007/978-3-030-87802-3_6
链接到相关资源的 DOI

提交历史

来自: Cristian Tejedor Garcia [查看电子邮件]
[v1] 星期三, 2023 年 6 月 7 日 06:58:38 UTC (342 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.CL
< 上一篇   |   下一篇 >
新的 | 最近的 | 2023-06
切换浏览方式为:
cs
cs.LG
cs.SD
eess
eess.AS
eess.SP

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号