电气工程与系统科学 > 图像与视频处理
[提交于 2025年8月19日
]
标题: TOM:一种具有多教师蒸馏和任务特定数据增强的开源舌头分割方法
标题: TOM: An Open-Source Tongue Segmentation Method with Multi-Teacher Distillation and Task-Specific Data Augmentation
摘要: 舌部成像作为一种有价值的诊断工具,特别是在中医(TCM)中。舌面分割的质量显著影响智能舌诊系统中舌部图像分类和后续诊断的准确性。然而,现有的舌部图像分割研究存在明显的局限性,缺乏稳健且用户友好的分割工具。本文提出了一种基于多教师知识蒸馏的舌部图像分割模型(TOM)。通过引入一种基于扩散的数据增强方法,我们在减少模型参数量的同时增强了分割模型的泛化能力。值得注意的是,在参数数量相比教师模型减少96.6%的情况下,学生模型仍实现了95.22% mIoU的出色分割性能。此外,我们将训练好的模型打包并部署为在线和离线分割工具(可在https://itongue.cn/获取),使中医从业者和研究人员无需任何编程经验即可使用。我们还展示了一个使用分割后的舌部区域进行中医体质分类的案例研究。实验结果表明,使用舌部区域进行训练比使用原始舌部图像具有更高的分类性能和更好的可解释性。据我们所知,这是第一个开源且免费的舌部图像分割工具。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.