计算机科学 > 机器学习
[提交于 2025年8月10日
]
标题: 基于扩散模型的分布外推荐因果负采样
标题: Causal Negative Sampling via Diffusion Model for Out-of-Distribution Recommendation
摘要: 启发式负采样通过从预定义的候选池中选择不同难度级别的负样本,以引导模型学习更准确的决策边界,从而提高推荐性能。 然而,我们的实证和理论分析表明,候选池中的未观察到的环境混杂因素(例如,曝光或流行度偏差)可能导致启发式采样方法引入虚假困难负样本(FHNS)。 这些误导性样本可能促使模型学习由这些混杂因素引起的虚假相关性,最终在分布变化下损害其泛化能力。 为了解决这个问题,我们提出了一种名为通过扩散进行因果负采样(CNSDiff)的新方法。 通过在潜在空间中通过条件扩散过程合成负样本,CNSDiff避免了预定义候选池带来的偏差,从而降低了生成FHNS的可能性。 此外,它还引入了一个因果正则化项,在负采样过程中显式缓解环境混杂因素的影响,从而产生促进分布外(OOD)泛化的鲁棒负样本。 在四种代表性分布变化场景下的全面实验表明,与最先进的基线方法相比,CNSDiff在所有评估指标上平均提升了13.96%,验证了其在分布外推荐任务中的有效性和鲁棒性。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.