计算机科学 > 声音
[提交于 2025年9月18日
(v1)
,最后修订 2025年9月20日 (此版本, v2)]
标题: 探索基础模型如何改变情感的音频效果
标题: Exploring How Audio Effects Alter Emotion with Foundation Models
摘要: 音频效果(FX),如混响、失真、调制和动态范围处理,在音乐聆听过程中对塑造情感反应起着关键作用。 尽管之前的研究已经探讨了低级音频特征与情感感知之间的联系,但音频FX对情绪的系统性影响仍研究不足。 这项工作研究了如何利用基础模型——在多模态数据上预训练的大规模神经架构——来分析这些效果。 这些模型在音乐结构、音色和情感意义之间建立了丰富的关联,为探究声音设计技术的情感后果提供了一个强大的框架。 通过将各种探测方法应用于深度学习模型的嵌入表示,我们研究了音频FX与估计情绪之间的复杂非线性关系,揭示了与特定效果相关的模式,并评估了基础音频模型的鲁棒性。 我们的研究结果旨在推进对音频制作实践感知影响的理解,对音乐认知、表演和情感计算具有重要意义。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.