numpy.random.gumbel¶
-
numpy.random.
gumbel
(loc=0.0, scale=1.0, size=None)¶ 从Gumbel分布中提取样本。
从具有指定位置和比例的Gumbel分布中提取样本。有关Gumbel分布的更多信息,请参阅下面的注释和参考资料。
参数: - loc : 浮点数或类似浮点数的数组,可选
分发模式的位置。默认值为0。
- 规模 : 浮点数或类似浮点数的数组,可选
分布的比例参数。默认值为1。
- size : int或int的元组,可选
输出形状。如果给定的形状是,例如,
(m, n, k)
然后m * n * k
取样。如果尺寸是None
(默认),如果loc
和scale
都是标量。否则,np.broadcast(loc, scale).size
取样。
返回: - out : ndarray或scalar
从参数化的Gumbel分布中提取样本。
笔记
Gumbel(或最小极值(SEV)或最小极值I型)分布是一类用于建模极值问题的广义极值(GEV)分布。Gumbel是具有“指数型”尾部分布的最大值的极值I型分布的特例。
Gumbel分布的概率密度为
p(x)=frac e^-(x-mu)/beta beta e^-e^-(x-mu)/beta,
在哪里? \mu 是模式、位置参数,以及 \beta 是比例参数。
Gumbel(以德国数学家Emil Julius Gumbel命名)在水文文献中很早就被用于模拟洪水事件的发生。它还用于模拟最大风速和降雨量。这是一种“肥尾”分布——分布尾部事件的概率比使用高斯分布的概率大,因此100年一遇洪水的频率惊人。洪水最初被建模为高斯过程,这低估了极端事件的频率。
它是一类极值分布,即广义极值分布,也包括威布尔分布和弗雷切特分布。
函数的平均值为 \mu + 0.57721\beta 和方差 \frac{{\pi^2}}{{6}}\beta^2 .
工具书类
[1] Gumbel,E.J.,“极端统计”,纽约:哥伦比亚大学出版社,1958年。 [2] Reiss,R.-D.和Thomas,M.,“保险、金融、水文和其他领域极端值的统计分析”,巴塞尔:Birkhauser-Verlag,2001年。 实例
从分发中抽取样本:
>>> mu, beta = 0, 0.1 # location and scale >>> s = np.random.gumbel(mu, beta, 1000)
显示样本的直方图,以及概率密度函数:
>>> import matplotlib.pyplot as plt >>> count, bins, ignored = plt.hist(s, 30, density=True) >>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta) ... * np.exp( -np.exp( -(bins - mu) /beta) ), ... linewidth=2, color='r') >>> plt.show()
演示如何从高斯过程中产生极值分布,并与高斯进行比较:
>>> means = [] >>> maxima = [] >>> for i in range(0,1000) : ... a = np.random.normal(mu, beta, 1000) ... means.append(a.mean()) ... maxima.append(a.max()) >>> count, bins, ignored = plt.hist(maxima, 30, density=True) >>> beta = np.std(maxima) * np.sqrt(6) / np.pi >>> mu = np.mean(maxima) - 0.57721*beta >>> plt.plot(bins, (1/beta)*np.exp(-(bins - mu)/beta) ... * np.exp(-np.exp(-(bins - mu)/beta)), ... linewidth=2, color='r') >>> plt.plot(bins, 1/(beta * np.sqrt(2 * np.pi)) ... * np.exp(-(bins - mu)**2 / (2 * beta**2)), ... linewidth=2, color='g') >>> plt.show()