计算机科学 > 计算与语言
[提交于 2025年10月9日
]
标题: 从噪声到信号到目的本身:重新定义NLP后训练时代的人类标签变化
标题: From Noise to Signal to Selbstzweck: Reframing Human Label Variation in the Era of Post-training in NLP
摘要: 人类标签差异(HLV)指的是在标注中合法的分歧,这种分歧反映了人类观点的真实多样性,而不是单纯的错误。 几十年来,自然语言处理(NLP)中的HLV被当作需要丢弃的噪声,直到最近十年才逐渐被重新视为提高模型鲁棒性的信号。 随着大型语言模型(LLMs)的兴起,对人类反馈进行训练已成为模型对齐的核心,HLV的作用变得越来越重要。 然而,当前的偏好学习数据集通常将多个标注合并为一个标签,从而将多样化的观点扁平化为虚假的普遍一致,抹去了对齐旨在保留的人类价值观的多元性。 在本文中,我们主张将HLV作为人类多元主义的体现,必须被视为一种目的本身——在设计人工智能系统时自身的目标。 我们呼吁主动将HLV纳入偏好数据集中,并提出了实现这一目标的可行步骤。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.