电气工程与系统科学 > 信号处理
[提交于 2024年3月1日
]
标题: 降解不变的音乐索引
标题: Degradation-Invariant Music Indexing
摘要: 为了构建对声音退化具有鲁棒性且适用于大规模音乐目录的音乐索引方法,本研究报告了一种基于与音乐内容相关的音频描述符的方法,并且这些描述符对声音变换(如噪声添加、失真、有损编码、音高/时间变换或滤波等)具有不变性。 为了实现这一目标,所提出方法的关键点之一是对高维音频特征的定义,这些特征本质上(通过设计)对某些声音退化具有鲁棒性。 然后利用这种表示的高维度来学习一个线性投影到显著较小的子空间,这通过一系列判别分析再次降低了对声音退化的敏感性。 最后,通过对选定的起始函数局部最大值进行时间锚定,执行一种近似哈希处理,以提供更好的比特损坏容错能力,同时使该方法更容易扩展。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.