电气工程与系统科学 > 音频与语音处理
[提交于 2023年6月2日
]
标题: 基于帧的频谱处理的相位器效果的可微灰盒建模
标题: Differentiable Grey-box Modelling of Phaser Effects using Frame-based Spectral Processing
摘要: 近年来,机器学习方法在建模模拟音频效果方面得到了深入研究,特别是在非线性时不变效果(如吉他放大器)的背景下。然而,对于如相位器之类的调制效果,由于存在控制缓慢时间变化效果的低频振荡器,会出现新的挑战。现有的方法要么需要预先知道该控制信号,要么在实现上是非因果的。本工作提出了一种可微分的数字信号处理方法来建模相位器效果,其中底层控制信号和时间变化的频谱响应是联合学习的。所提出的模型通过在频域中处理音频的短帧来实现时间变化的滤波器,其传递函数基于典型的模拟相位器电路拓扑结构。我们展示了该模型可以被训练以模仿模拟参考设备,同时保留可解释和可调整的参数。帧长度是所提模型的重要超参数,因此对其对模型准确性的影响进行了研究。最佳帧长度取决于目标效果的速率和瞬态衰减时间,但在推理时可以改变帧长度而不会显著影响准确性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.