电气工程与系统科学 > 音频与语音处理
            [提交于 2025年8月6日
            
            
            
            ]
          
          标题: 面向可解释的情感识别:使用机器学习识别关键特征
标题: Towards interpretable emotion recognition: Identifying key features with machine learning
摘要: 无监督方法,如wav2vec2和HuBERT,在音频任务中取得了最先进的性能,导致研究重点从可解释特征转向其他方向。 然而,这些方法缺乏可解释性,限制了它们在医学等关键领域中的应用,因为在这些领域中理解特征的相关性至关重要。 为了更好地理解无监督模型的特征,识别与给定任务相关的可解释特征仍然至关重要。 在本工作中,我们专注于情感识别,并使用机器学习算法来识别和推广与此任务最重要的可解释特征。 虽然以前的研究已经探索了情感识别中的特征相关性,但它们通常受到狭窄情境的限制,并且结果不一致。 我们的方法旨在克服这些局限性,为识别最重要的可解释特征提供一个更广泛、更稳健的框架。
文献和引用工具
与本文相关的代码,数据和媒体
            alphaXiv (什么是 alphaXiv?)
          
        
            CatalyzeX 代码查找器 (什么是 CatalyzeX?)
          
        
            DagsHub (什么是 DagsHub?)
          
        
            Gotit.pub (什么是 GotitPub?)
          
        
            Hugging Face (什么是 Huggingface?)
          
        
            带有代码的论文 (什么是带有代码的论文?)
          
        
            ScienceCast (什么是 ScienceCast?)
          
        演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.
 
  