Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > eess > arXiv:2306.01332v1

帮助 | 高级搜索

电气工程与系统科学 > 音频与语音处理

arXiv:2306.01332v1 (eess)
[提交于 2023年6月2日 ]

标题: 基于帧的频谱处理的相位器效果的可微灰盒建模

标题: Differentiable Grey-box Modelling of Phaser Effects using Frame-based Spectral Processing

Authors:Alistair Carson, Cassia Valentini-Botinhao, Simon King, Stefan Bilbao
摘要: 近年来,机器学习方法在建模模拟音频效果方面得到了深入研究,特别是在非线性时不变效果(如吉他放大器)的背景下。然而,对于如相位器之类的调制效果,由于存在控制缓慢时间变化效果的低频振荡器,会出现新的挑战。现有的方法要么需要预先知道该控制信号,要么在实现上是非因果的。本工作提出了一种可微分的数字信号处理方法来建模相位器效果,其中底层控制信号和时间变化的频谱响应是联合学习的。所提出的模型通过在频域中处理音频的短帧来实现时间变化的滤波器,其传递函数基于典型的模拟相位器电路拓扑结构。我们展示了该模型可以被训练以模仿模拟参考设备,同时保留可解释和可调整的参数。帧长度是所提模型的重要超参数,因此对其对模型准确性的影响进行了研究。最佳帧长度取决于目标效果的速率和瞬态衰减时间,但在推理时可以改变帧长度而不会显著影响准确性。
摘要: Machine learning approaches to modelling analog audio effects have seen intensive investigation in recent years, particularly in the context of non-linear time-invariant effects such as guitar amplifiers. For modulation effects such as phasers, however, new challenges emerge due to the presence of the low-frequency oscillator which controls the slowly time-varying nature of the effect. Existing approaches have either required foreknowledge of this control signal, or have been non-causal in implementation. This work presents a differentiable digital signal processing approach to modelling phaser effects in which the underlying control signal and time-varying spectral response of the effect are jointly learned. The proposed model processes audio in short frames to implement a time-varying filter in the frequency domain, with a transfer function based on typical analog phaser circuit topology. We show that the model can be trained to emulate an analog reference device, while retaining interpretable and adjustable parameters. The frame duration is an important hyper-parameter of the proposed model, so an investigation was carried out into its effect on model accuracy. The optimal frame length depends on both the rate and transient decay-time of the target effect, but the frame length can be altered at inference time without a significant change in accuracy.
评论: 已接受发表于DAFx23会议论文集,丹麦哥本哈根,2023年9月
主题: 音频与语音处理 (eess.AS) ; 机器学习 (cs.LG); 声音 (cs.SD)
引用方式: arXiv:2306.01332 [eess.AS]
  (或者 arXiv:2306.01332v1 [eess.AS] 对于此版本)
  https://doi.org/10.48550/arXiv.2306.01332
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Alistair Carson [查看电子邮件]
[v1] 星期五, 2023 年 6 月 2 日 07:53:41 UTC (2,355 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
eess.AS
< 上一篇   |   下一篇 >
新的 | 最近的 | 2023-06
切换浏览方式为:
cs
cs.LG
cs.SD
eess

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号