上一个主题

numpy.random.RandomState.gumbel

下一个主题

numpy.random.RandomState.laplace

numpy.random.RandomState.hypergeometric

方法

RandomState.hypergeometric(ngood, nbad, nsample, size=None)

从超几何分布中提取样本。

从具有指定参数的超几何分布、ngood(做出良好选择的方法)、nbad(做出错误选择的方法)和nsample=抽样项目数(小于或等于ngood+nbad之和)中提取样本。

参数:
恩古德 : int或类似于int的数组

做一个好选择的方法有很多。必须为非负。

nbad : int或类似于int的数组

做出错误选择的方法的数目。必须为非负。

NSt样 : int或类似于int的数组

抽样的项目数。必须至少为1且最多为 ngood + nbad .

size : int或int的元组,可选

输出形状。如果给定的形状是,例如, (m, n, k) 然后 m * n * k 取样。如果尺寸是 None (默认),如果 ngoodnbadnsample 都是鳞片。否则, np.broadcast(ngood, nbad, nsample).size 取样。

返回:
out : ndarray或scalar

从参数化超几何分布中提取样本。

参见

scipy.stats.hypergeom
概率密度函数、分布或累积密度函数等。

笔记

超几何分布的概率密度是

p(x)=frac binom g x binom b n-x binom g+b n,

在哪里? 0 \le x \le nn-b \le x \le g

对于p(x),x成功的概率,g=ngood,b=nbad,n=样本数。

考虑一个有黑白大理石的骨灰缸,其中黑色和NBAD是白色的。如果绘制不替换的简单球,则超几何分布描述了绘制样本中黑色球的分布。

注意,这种分布与二项式分布非常相似,只是在这种情况下,样本是不替换地抽取的,而在二项式情况下,样本是用替换的方式抽取的(或者样本空间是无限的)。当样本空间变大时,这种分布接近二项式分布。

工具书类

[1]Lenner,Marvin,“基础应用统计学”,Bogden和Quigley,1972年。
[2]超几何分布〉,摘自《数学世界——一个Wolfram网络资源》。http://mathworld.wolfram.com/hypergeometricdistribution.html
[3]维基百科,“超几何分布”,https://en.wikipedia.org/wiki/hypergeometric_distribution

实例

从分发中抽取样本:

>>> ngood, nbad, nsamp = 100, 2, 10
# number of good, number of bad, and number of samples
>>> s = np.random.hypergeometric(ngood, nbad, nsamp, 1000)
>>> from matplotlib.pyplot import hist
>>> hist(s)
#   note that it is very unlikely to grab both bad items

假设你有一个15个白色和15个黑色大理石的骨灰缸。如果你随机抽取15颗弹珠,那么其中12颗或更多是一种颜色的可能性有多大?

>>> s = np.random.hypergeometric(15, 15, 15, 100000)
>>> sum(s>=12)/100000. + sum(s<=3)/100000.
#   answer = 0.003 ... pretty unlikely!