计算机科学 > 图形学
[提交于 2025年10月10日
]
标题: MCMC:连接渲染、优化和生成式人工智能
标题: MCMC: Bridging Rendering, Optimization and Generative AI
摘要: 生成式人工智能(AI)在过去两年中在视觉语言模型方面取得了前所未有的进展。 在生成过程中,从一个未知的高维分布中生成新的样本(图像)。 马尔可夫链蒙特卡洛(MCMC)方法在从这种复杂、高维分布中抽样时特别有效。 这使得MCMC方法成为EBM等模型的重要组成部分,确保准确的样本生成。 基于梯度的优化是现代生成模型的核心。 优化过程中的更新步骤形成一个马尔可夫链,其中新的更新仅依赖于当前状态。 这允许以无记忆的方式探索参数空间,从而结合基于梯度的优化和MCMC采样的优势。 在基于物理的渲染中,MCMC方法也表现出同样重要的作用,因为复杂的光路 otherwise 很难通过简单的重要性抽样技术进行抽样。 许多研究致力于以数据驱动的方式将物理真实性带入从扩散基生成模型生成的样本(图像),然而,连接这些技术的统一框架仍然缺失。 在本课程中,我们迈出第一步,以理解每个组件并探索MCMC如何可能作为桥梁,连接这些密切相关的研究领域。 我们的课程旨在为学生、研究人员和实践者提供必要的理论和实践工具,以实现生成式基于物理的渲染的共同目标。 所有与本教程相关的Jupyter笔记本均可在项目网页上找到:https://sinbag.github.io/mcmc/
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.