计算机科学 > 数据库
[提交于 2018年5月26日
]
标题: 基于模型的定价方法在数据市场中的机器学习应用
标题: Model-based Pricing for Machine Learning in a Data Marketplace
摘要: 数据挖掘使用机器学习(ML)在科学、商业智能、新闻报道和其他许多领域已经成为普遍现象。 虽然很多工作集中在降低机器学习模型的训练成本、推理运行时间和存储成本,但很少有工作研究如何降低数据获取的成本,这可能会导致卖家收入的损失和买家的负担能力和效率的下降。 在本文中,我们提出了一种基于模型的定价(MBP)框架,该框架不是对数据进行定价,而是直接对机器学习模型实例进行定价。 我们首先正式描述了MBP框架所需的特性,重点是避免套利。 接下来,我们通过一种噪声注入方法展示了MBP框架的具体实现,该方法可以证明满足所需的正式特性。 基于所提出的框架,我们随后提供了算法解决方案,说明卖方如何在不同的市场情景(如最大化收入)下为模型分配价格。 最后,我们进行了广泛的实验,结果表明MBP框架可以为卖方提供高收入,为买方提供高可负担性,并且可以在低运行时间成本下运行。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.