数学 > 统计理论
[提交于 2025年8月7日
]
标题: 使用级联排除估计集合的大小
标题: Estimating the size of a set using cascading exclusion
摘要: 设$S$为一个有限集合,$X_1,\ldots,X_n$为从$S$中独立同分布的均匀样本。为了估计大小$|S|$,在没有进一步结构的情况下,可以等待重复并利用生日问题。这需要样本量约为$|S|^\frac{1}{2}$。另一方面,如果$S=\{1,2,\ldots,|S|\}$,通过将样本放大$n/(n-1)$得到的最大值给出了一个基于任何增长样本量的有效估计量。本文给出了在这些极端情况之间的改进方法。发展了一种一般的非渐近理论。这包括估计紧凸集的体积、未被观测到的物种问题,以及从问题“这个新观测是否是从一个大预定义总体中典型的选取?”中得出的一系列检验问题。我们还处理了回归风格的预测器。 一个普遍定理在所有情况下给出了非参数有限$n$误差界。
当前浏览上下文:
math.ST
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.