计算机科学 > 机器学习
[提交于 2025年7月31日
]
标题: EB-gMCR:基于能量的信号解混与多变量曲线分辨生成建模
标题: EB-gMCR: Energy-Based Generative Modeling for Signal Unmixing and Multivariate Curve Resolution
摘要: 信号解混分析将数据分解为基本模式,并广泛应用于化学和生物研究中。多变量曲线解析(MCR)是信号解混的一个分支,它将混合的化学信号分离为基础模式(成分)及其浓度,在理解组成方面起着关键作用。经典的MCR通常被表述为矩阵分解(MF),并需要用户指定成分数量,而在实际数据中这个数量通常是未知的。随着数据集大小或成分数量的增加,基于MF的MCR的可扩展性和可靠性面临重大挑战。本研究将MCR重新表述为生成过程(gMCR),并引入了一种基于能量的深度学习求解器EB-gMCR,该求解器能够自动发现最小的成分集合,以准确重建数据。EB-gMCR从一个大的候选池(例如,1024个光谱)开始,并使用可微分的门控网络仅保留活跃的成分同时估计它们的浓度。在包含最多256个潜在源的噪声合成数据集上,EB-gMCR保持R^2 >= 0.98,并在5%以内恢复了成分数量;在较低噪声下,它实现了R^2 >= 0.99,并且几乎精确地估计了成分数量。额外的化学先验条件,如非负性或非线性混合,作为简单的插件函数引入,使得模型能够适应其他仪器或领域而无需改变核心学习过程。通过结合高容量的生成建模和硬性成分选择,EB-gMCR为大规模信号解混分析提供了一条实用的路径,包括化学库驱动的场景。源代码可在https://github.com/b05611038/ebgmcr_solver获取。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.