numpy.random.hypergeometric¶
-
numpy.random.
hypergeometric
(ngood, nbad, nsample, size=None)¶ 从超几何分布中提取样本。
从具有指定参数的超几何分布、ngood(做出良好选择的方法)、nbad(做出错误选择的方法)和nsample=抽样项目数(小于或等于ngood+nbad之和)中提取样本。
参数: - 恩古德 : int或类似于int的数组
做一个好选择的方法有很多。必须为非负。
- nbad : int或类似于int的数组
做出错误选择的方法的数目。必须为非负。
- NSt样 : int或类似于int的数组
抽样的项目数。必须至少为1且最多为
ngood + nbad
.- size : int或int的元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k)
然后m * n * k
取样。如果尺寸是None
(默认),如果ngood
,nbad
和nsample
都是鳞片。否则,np.broadcast(ngood, nbad, nsample).size
取样。
返回: - out : ndarray或scalar
从参数化超几何分布中提取样本。
参见
scipy.stats.hypergeom
- 概率密度函数、分布或累积密度函数等。
笔记
超几何分布的概率密度是
p(x)=frac binom g x binom b n-x binom g+b n,
在哪里? 0 \le x \le n 和 n-b \le x \le g
对于p(x),x成功的概率,g=ngood,b=nbad,n=样本数。
考虑一个有黑白大理石的骨灰缸,其中黑色和NBAD是白色的。如果绘制不替换的简单球,则超几何分布描述了绘制样本中黑色球的分布。
注意,这种分布与二项式分布非常相似,只是在这种情况下,样本是不替换地抽取的,而在二项式情况下,样本是用替换的方式抽取的(或者样本空间是无限的)。当样本空间变大时,这种分布接近二项式分布。
工具书类
[1] Lenner,Marvin,“基础应用统计学”,Bogden和Quigley,1972年。 [2] 超几何分布〉,摘自《数学世界——一个Wolfram网络资源》。http://mathworld.wolfram.com/hypergeometricdistribution.html [3] 维基百科,“超几何分布”,https://en.wikipedia.org/wiki/hypergeometric_distribution 实例
从分发中抽取样本:
>>> ngood, nbad, nsamp = 100, 2, 10 # number of good, number of bad, and number of samples >>> s = np.random.hypergeometric(ngood, nbad, nsamp, 1000) >>> from matplotlib.pyplot import hist >>> hist(s) # note that it is very unlikely to grab both bad items
假设你有一个15个白色和15个黑色大理石的骨灰缸。如果你随机抽取15颗弹珠,那么其中12颗或更多是一种颜色的可能性有多大?
>>> s = np.random.hypergeometric(15, 15, 15, 100000) >>> sum(s>=12)/100000. + sum(s<=3)/100000. # answer = 0.003 ... pretty unlikely!