计算机科学 > 计算与语言
[提交于 2023年6月5日
(v1)
,最后修订 2024年1月26日 (此版本, v2)]
标题: 每个输入的多个输出样本在单输出高斯过程中的应用
标题: Multiple output samples per input in a single-output Gaussian process
摘要: 标准高斯过程(GP)仅在训练集中每个输入处考虑一个输出样本。 主观任务的数据集,例如口语语言评估,可能每个输入都有多个人类评分者的输出标签进行标注。 本文提出将GP推广,以允许训练集中存在这些多个输出样本,从而利用可用的输出不确定性信息。 这与多输出GP不同,因为所有输出样本都来自同一任务。 输出密度函数被制定为观察所有输出样本的联合似然,且不重复潜在变量以减少计算成本。 测试集的预测类似于标准GP的推断,区别在于优化的超参数。 这在speechocean762上进行了评估,结果表明它使GP能够计算出与多个人类评分者的参考输出集合更相似的测试集输出分布。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.