numpy.random.normal¶
-
numpy.random.
normal
(loc=0.0, scale=1.0, size=None)¶ 从正态(高斯)分布中随机抽取样本。
正态分布的概率密度函数,首先由de moivre推导,200年后由高斯和拉普拉斯独立推导。 [2], 由于其特征形状,通常称为钟形曲线(见下例)。
正态分布在自然界中经常发生。例如,它描述了受大量微小的随机干扰影响的样品的常见分布,每个干扰都有其独特的分布。 [2].
参数: - loc : 浮点数或类似浮点数的数组
分布的平均值(“中心”)。
- 规模 : 浮点数或类似浮点数的数组
分布的标准偏差(扩展或“宽度”)。
- size : int或int的元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k)
然后m * n * k
取样。如果尺寸是None
(默认),如果loc
和scale
都是标量。否则,np.broadcast(loc, scale).size
取样。
返回: - out : ndarray或scalar
从参数化正态分布中提取样本。
参见
scipy.stats.norm
- 概率密度函数、分布或累积密度函数等。
笔记
高斯分布的概率密度是
p(x)=frac 1 sqrt 2 pi sigma^2-frac(x-mu)^2 2 sigma^2,
在哪里? \mu 是均值和 \sigma 标准偏差。标准差的平方, \sigma^2 ,称为方差。
函数在平均值处有峰值,其“扩展”随标准差而增大(函数在平均值处达到其最大值的0.607倍 x + \sigma 和 x - \sigma [2]) . 这意味着
numpy.random.normal
更可能返回接近平均值的样本,而不是那些远离平均值的样本。工具书类
[1] 维基百科,“正态分布”,https://en.wikipedia.org/wiki/normal_distribution [2] (1, 2, 3, 4) P.R.Peebles Jr.,“概率、随机变量和随机信号原理”中的“中心极限定理”,第4版,2001年,第51、51、125页。 实例
从分发中抽取样本:
>>> mu, sigma = 0, 0.1 # mean and standard deviation >>> s = np.random.normal(mu, sigma, 1000)
验证平均值和方差:
>>> abs(mu - np.mean(s)) < 0.01 True
>>> abs(sigma - np.std(s, ddof=1)) < 0.01 True
显示样本的直方图,以及概率密度函数:
>>> import matplotlib.pyplot as plt >>> count, bins, ignored = plt.hist(s, 30, density=True) >>> plt.plot(bins, 1/(sigma * np.sqrt(2 * np.pi)) * ... np.exp( - (bins - mu)**2 / (2 * sigma**2) ), ... linewidth=2, color='r') >>> plt.show()