numpy.random.RandomState.binomial¶
方法
-
RandomState.
binomial
(n, p, size=None)¶ 从二项式分布中提取样本。
样本从二项分布中提取,其中n个整数大于等于0,p在区间内,n个试验和p成功概率为指定参数。 [0,1] . (n可以作为浮点输入,但被截断为使用中的整数)
参数: - n : int或类似于int的数组
分布的参数,>=0。也接受浮动,但它们将被截断为整数。
- p : 浮点数或类似浮点数的数组
分布的参数,>=0且<=1。
- size : int或int的元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k)
然后m * n * k
取样。如果尺寸是None
(默认),如果n
和p
都是标量。否则,np.broadcast(n, p).size
取样。
返回: - out : ndarray或scalar
从参数化二项分布中提取样本,其中每个样本等于n次试验的成功次数。
参见
scipy.stats.binom
- 概率密度函数、分布或累积密度函数等。
笔记
二项分布的概率密度是
p(n)=binom n n p^n(1-p)^ n-n,
在哪里? n 是试验次数, p 是成功的概率,以及 N 是成功的次数。
当用随机样本估计一个群体中某一比例的标准误差时,正态分布很好地工作,除非产品p n <=5, where p = population proportion estimate, and n = number of samples, in which case the binomial distribution is used instead. For example, a sample of 15 people shows 4 who are left handed, and 11 who are right handed. Then p = 4/15 = 27%. 0.27 15=4,所以在这种情况下应该使用二项分布。
工具书类
[1] Dalgaard,Peter,“R导论统计”,Springer Verlag,2002年。 [2] Glantz,Stanton A.,《生物统计学入门》,McGraw-Hill,第五版,2002年。 [3] Lenner,Marvin,“基础应用统计学”,Bogden和Quigley,1972年。 [4] 二项分布〉,摘自《数学世界——一个Wolfram网络资源》。http://mathworld.wolfram.com/binomialddistribution.html [5] 维基百科,“二项分布”,https://en.wikipedia.org/wiki/binomial_distribution 实例
从分发中抽取样本:
>>> n, p = 10, .5 # number of trials, probability of each trial >>> s = np.random.binomial(n, p, 1000) # result of flipping a coin 10 times, tested 1000 times.
一个现实世界的例子。一家公司钻了9口野生猫科石油勘探井,每口井的成功概率估计为0.1。所有九口井都失败了。发生这种情况的可能性有多大?
让我们对模型进行20000次试验,并计算产生零正结果的数字。
>>> sum(np.random.binomial(9, 0.1, 20000) == 0)/20000. # answer = 0.38885, or 38%.