计算机科学 > 机器学习
[提交于 2023年9月4日
]
标题: FinDiff:用于金融表格数据生成的扩散模型
标题: FinDiff: Diffusion Models for Financial Tabular Data Generation
摘要: 监管机构共享微数据,如基金持仓和衍生工具,由于严格的数据保密和隐私法规,面临独特的挑战。 这些挑战常常阻碍学术界和实践者有效进行协作研究。 生成模型的出现,特别是能够合成模仿现实世界数据基础分布的数据的扩散模型,提供了一个有吸引力的解决方案。 本工作介绍了“FinDiff”,一种设计用于生成真实世界金融表格数据的扩散模型,适用于多种监管下游任务,例如经济情景建模、压力测试和欺诈检测。 该模型使用嵌入编码来对包含分类和数值属性的混合模式金融数据进行建模。 FinDiff在生成合成表格金融数据方面的性能通过三个真实世界金融数据集(包括两个公开数据集和一个专有数据集)与最先进的基线模型进行了评估。 实证结果表明,FinDiff在生成高保真度、隐私性和实用性均高的合成表格金融数据方面表现出色。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.