计算机科学 > 声音
[提交于 2023年6月5日
]
标题: DeepVQE:用于联合声学回声消除、噪声抑制和去混响的实时深度语音质量增强
标题: DeepVQE: Real Time Deep Voice Quality Enhancement for Joint Acoustic Echo Cancellation, Noise Suppression and Dereverberation
摘要: 声学回声消除(AEC)、噪声抑制(NS)和去混响(DR)是现代全双工通信系统不可或缺的一部分。随着对视频会议系统需求的增加,解决这些任务对于实现高效且有效的在线会议体验至关重要。大多数先前的研究分别提出了解决这些任务的方案,将其与基于数字信号处理(DSP)的组件结合,导致了复杂且在实际应用中往往不切实际的处理流程。本文提出了一种实时的交叉注意力深度模型,称为DeepVQE,该模型基于残差卷积神经网络(CNNs)和循环神经网络(RNNs),以同时处理AEC、NS和DR。我们进行了多项消融研究,以分析模型不同组件对整体性能的贡献。DeepVQE在ICASSP 2023声学回声消除挑战赛和ICASSP 2023深度噪声抑制挑战赛的非个性化测试集上达到了最先进水平,表明一个模型可以以卓越的性能处理多个任务。此外,该模型能够实时运行,并已在Microsoft Teams平台上成功测试。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.