计算机科学 > 机器学习
[提交于 2025年8月6日
]
标题: 可证明的训练后量化:OPTQ和Qronos的理论分析
标题: Provable Post-Training Quantization: Theoretical Analysis of OPTQ and Qronos
摘要: 后训练量化(PTQ)已成为减少现代深度神经网络,包括大型语言模型(LLMs)的内存和计算成本的关键工具。 在PTQ算法中,OPTQ框架——也称为GPTQ——由于其计算效率和强大的经验性能而成为一种领先的 方法。 然而,尽管被广泛采用,OPTQ缺乏严格的定量理论保证。 本文首次为OPTQ的确定性和随机变体以及Qronos——一种最近相关的最先进的PTQ算法——提供了定量误差界限。 我们分析了OPTQ的迭代过程如何引起量化误差,并推导出依赖于校准数据和OPTQ使用的正则化参数的非渐近2-范数误差界限。 我们的分析为几个实际设计选择提供了理论依据,包括广泛使用的按降序范数排序特征的启发式方法,以及选择正则化参数的指导。 对于随机变体,我们建立了更强的无穷范数误差界限,这可以控制所需的量化字母表,并且对下游层和非线性特别有用。 最后,我们将分析扩展到Qronos,为它的确定性和随机变体提供了新的理论界限,有助于解释其经验优势。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.