计算机科学 > 计算机视觉与模式识别
[提交于 2025年9月15日
]
标题: 3DViT-GAT:一种基于统一图谱的三维视觉变换器和图学习框架,用于使用结构磁共振成像数据检测重度抑郁症
标题: 3DViT-GAT: A Unified Atlas-Based 3D Vision Transformer and Graph Learning Framework for Major Depressive Disorder Detection Using Structural MRI Data
摘要: 重度抑郁症(MDD)是一种普遍的心理健康状况,对个人福祉和全球公共卫生产生负面影响。 使用结构磁共振成像(sMRI)和深度学习(DL)方法进行MDD的自动检测,有望提高诊断准确性并实现早期干预。 现有的大多数方法仅采用体素级特征或从预定义的大脑图谱构建的手工区域表示,限制了它们捕捉复杂大脑模式的能力。 本文开发了一个统一的流程,利用视觉变压器(ViTs)从sMRI数据中提取3D区域嵌入,并利用图神经网络(GNN)进行分类。 我们探索了两种定义区域的策略:(1)基于图谱的方法,使用预定义的结构和功能大脑图谱,以及(2)基于立方体的方法,其中ViTs被直接训练从均匀提取的3D块中识别区域。 此外,生成余弦相似性图以建模区域间的关系,并指导基于GNN的分类。 进行了大量实验,使用REST-meta-MDD数据集来证明我们模型的有效性。 通过分层的10折交叉验证,最佳模型获得了78.98%的准确率,76.54%的灵敏度,81.58%的特异性,81.58%的精确率,以及78.98%的F1分数。 此外,基于图谱的模型始终优于基于立方体的方法,突显了在MDD检测中使用领域特定解剖先验的重要性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.