连续统计分布¶
概述¶
所有分布都将具有位置(L)和比例(S)参数以及所需的任何形状参数,形状参数的名称会有所不同。在下列情况下,将给出分发的标准格式 \(L=0.0\) 和 \(S=1.0.\) 各种功能的非标准表格可以使用(注: \(U\) 是标准的均匀随机变量)。
函数名称 |
标准函数 |
转型 |
---|---|---|
累积分布函数(CDF) |
\(F\left(x\right)\) |
\(F\left(x;L,S\right)=F\left(\frac{\left(x-L\right)}{S}\right)\) |
概率密度函数(PDF) |
\(f\left(x\right)=F^{\prime}\left(x\right)\) |
\(f\left(x;L,S\right)=\frac{1}{S}f\left(\frac{\left(x-L\right)}{S}\right)\) |
百分比点函数(PPF) |
\(G\left(q\right)=F^{-1}\left(q\right)\) |
\(G\left(q;L,S\right)=L+SG\left(q\right)\) |
概率稀疏函数(PSF) |
\(g\left(q\right)=G^{\prime}\left(q\right)\) |
\(g\left(q;L,S\right)=Sg\left(q\right)\) |
危险函数(HF) |
\(h_{a}\left(x\right)=\frac{f\left(x\right)}{1-F\left(x\right)}\) |
\(h_{a}\left(x;L,S\right)=\frac{1}{S}h_{a}\left(\frac{\left(x-L\right)}{S}\right)\) |
累积危险函数(CHF) |
\(H_{a}\left(x\right)=\) \(\log\frac{1}{1-F\left(x\right)}\) |
\(H_{a}\left(x;L,S\right)=H_{a}\left(\frac{\left(x-L\right)}{S}\right)\) |
生存函数(SF) |
\(S\left(x\right)=1-F\left(x\right)\) |
\(S\left(x;L,S\right)=S\left(\frac{\left(x-L\right)}{S}\right)\) |
逆生存函数(ISF) |
\(Z\left(\alpha\right)=S^{-1}\left(\alpha\right)=G\left(1-\alpha\right)\) |
\(Z\left(\alpha;L,S\right)=L+SZ\left(\alpha\right)\) |
矩母函数(MGF) |
\(M_{Y}\left(t\right)=E\left[e^{Yt}\right]\) |
\(M_{X}\left(t\right)=e^{Lt}M_{Y}\left(St\right)\) |
随机变量 |
\(Y=G\left(U\right)\) |
\(X=L+SY\) |
(微分)熵 |
\(h\left[Y\right]=-\int f\left(y\right)\log f\left(y\right)dy\) |
\(h\left[X\right]=h\left[Y\right]+\log S\) |
(非中心)矩 |
\(\mu_{n}^{\prime}=E\left[Y^{n}\right]\) |
\(E\left[X^{n}\right]=L^{n}\sum_{k=0}^{N}\left(\begin{array}{c} n\\ k\end{array}\right)\left(\frac{S}{L}\right)^{k}\mu_{k}^{\prime}\) |
中心时刻 |
\(\mu_{n}=E\left[\left(Y-\mu\right)^{n}\right]\) |
\(E\left[\left(X-\mu_{X}\right)^{n}\right]=S^{n}\mu_{n}\) |
平均值(模式,中值),变量 |
\(\mu,\,\mu_{2}\) |
\(L+S\mu,\, S^{2}\mu_{2}\) |
偏斜度 |
\(\gamma_{1}=\frac{\mu_{3}}{\left(\mu_{2}\right)^{3/2}}\) |
\(\gamma_{1}\) |
峰度 |
\(\gamma_{2}=\frac{\mu_{4}}{\left(\mu_{2}\right)^{2}}-3\) |
\(\gamma_{2}\) |
时刻¶
非中心矩是使用PDF定义的
请注意,这些值始终可以使用PPF计算。替身 \(x=G\left(q\right)\) 在上面的方程式中,并得到
这可能更容易进行数值计算。请注意, \(q=F\left(x\right)\) 所以 \(dq=f\left(x\right)dx.\) 中心矩的计算方法类似 \(\mu=\mu_{{1}}^{{\prime}}\)
尤其是
偏度定义为
而(费舍尔)峰度是
所以正态分布的峰度为零。
中位数和模式¶
中位数, \(m_{{n}}\) 定义为密度的一半在一边,另一半在另一边的点。换句话说, \(F\left(m_{{n}}\right)=\frac{{1}}{{2}}\) 所以
另外,这个模式, \(m_{{d}}\) ,定义为概率密度函数达到峰值的值
拟合数据¶
为了将数据拟合到分布中,最大似然函数是很常见的。或者,一些分布具有众所周知的最小方差无偏估计。默认情况下将选择这些参数,但似然函数始终可用于最小化。
如果 \(f\left(x;\boldsymbol{{\theta}}\right)\) 是随机变量的PDF,其中 \(\boldsymbol{{\theta}}\) 是参数的向量( e.g. \(L\) 和 \(S\) ),则用于 \(N\) 从这个分布中独立样本,联合分布随机向量 \(\mathbf{{x}}\) 是
参数的最大似然估计 \(\boldsymbol{{\theta}}\) 是使此函数最大化的参数 \(\mathbf{{x}}\) 由数据固定和给定的:
哪里
请注意,如果 \(\boldsymbol{{\theta}}\) 仅包括形状参数,位置参数和比例参数可以通过替换 \(x_{{i}}\) 使用 \(\left(x_{{i}}-L\right)/S\) 在对数似然函数相加 \(N\log S\) 和最小化,因此
如果需要,请提供以下示例估计 \(L\) 和 \(S\) (不一定是最大似然估计)可以从均值和方差的样本估计中使用
哪里 \(\mu\) 和 \(\mu_{{2}}\) 的均值和方差假定为 未变换的 分布(何时 \(L=0\) 和 \(S=1\) )和
平均值的标准记法¶
我们将使用
哪里 \(N\) 应从上下文中清楚地看出样本的数量 \(x_{{i}}\)
参考文献¶
ranlib、rv2、cdflib的文档
埃里克·韦斯坦的数学世界http://mathworld.wolfram.com/,http://mathworld.wolfram.com/topics/StatisticalDistributions.html
“回归+的文档”,迈克尔·麦克劳克林的“项目工程和统计手册”(NIST),https://www.itl.nist.gov/div898/handbook/
来自美国国家标准与技术研究院(https://www.itl.nist.gov/div898/software/dataplot/distribu.htm)的DATAPLOT文档
诺曼·约翰逊,塞缪尔·科茨和N·巴拉克里希南,连续单变量分布,第二版,第一卷和第二卷,威利父子出版社,1994年。
在本教程中,几个特殊函数反复出现,并在此处列出。
符号 |
描述 |
定义 |
---|---|---|
\(\gamma\left(s, x\right)\) |
下不完全Gamma函数 |
\(\int_0^x t^{s-1} e^{-t} dt\) |
\(\Gamma\left(s, x\right)\) |
上不完全Gamma函数 |
\(\int_x^\infty t^{s-1} e^{-t} dt\) |
\(B\left(x;a,b\right)\) |
不完整的Beta函数 |
\(\int_{0}^{x} t^{a-1}\left(1-t\right)^{b-1} dt\) |
\(I\left(x;a,b\right)\) |
正则化不完全Beta函数 |
\(\frac{\Gamma\left(a+b\right)}{\Gamma\left(a\right)\Gamma\left(b\right)} \int_{0}^{x} t^{a-1}\left(1-t\right)^{b-1} dt\) |
\(\phi\left(x\right)\) |
正态分布的PDF格式 |
\(\frac{1}{\sqrt{2\pi}}e^{-x^{2}/2}\) |
\(\Phi\left(x\right)\) |
正态分布的CDF |
\(\int_{-\infty}^{x}\phi\left(t\right) dt = \frac{1}{2}+\frac{1}{2}\mathrm{erf}\left(\frac{x}{\sqrt{2}}\right)\) |
\(\psi\left(z\right)\) |
Digamma函数 |
\(\frac{d}{dz} \log\left(\Gamma\left(z\right)\right)\) |
\(\psi_{n}\left(z\right)\) |
多伽马函数 |
\(\frac{d^{n+1}}{dz^{n+1}}\log\left(\Gamma\left(z\right)\right)\) |
\(I_{\nu}\left(y\right)\) |
修正的第一类贝塞尔函数 |
|
\(\mathrm{Ei}(\mathrm{z})\) |
指数积分 |
\(-\int_{-x}^\infty \frac{e^{-t}}{t} dt\) |
\(\zeta\left(n\right)\) |
Riemann Zeta函数 |
\(\sum_{k=1}^{\infty} \frac{1}{k^{n}}\) |
\(\zeta\left(n,z\right)\) |
Hurwitz Zeta函数 |
\(\sum_{k=0}^{\infty} \frac{1}{\left(k+z\right)^{n}}\) |
\(\,{}_{p}F_{q}(a_{1},\ldots,a_{p};b_{1},\ldots,b_{q};z)\) |
超几何函数 |
\(\sum_{n=0}^{\infty} {\frac{(a_{1})_{n}\cdots(a_{p})_{n}}{(b_{1})_{n}\cdots(b_{q})_{n}}} \,{\frac{z^{n}}{n!}}\) |
中的连续分布 scipy.stats
¶
- Alpha分布
- 角度分布
- 反正弦分布
- 贝塔分布
- 贝塔质数分布
- 布拉德福德分布
- 毛刺分布
- 毛刺12分布
- 柯西分布
- 偏柯西分布
- CHI分布
- 卡方分布
- 余弦分布
- 双伽马分布
- 双重威布尔分布
- Erlang分布
- 指数分布
- 推广的威布尔分布
- 指数功率分布
- 疲劳寿命(Birnbaum-Saunders)分布
- FISK(日志物流)分配
- 折叠柯西分布
- 折叠正态分布
- F比(或F)分布
- 伽马分布
- 广义Logistic分布
- 广义帕累托分布
- 广义指数分布
- 广义极值分布
- 广义伽玛分布
- 广义半Logistic分布
- 广义双曲分布
- 广义逆高斯分布
- 广义正态分布
- 吉尔布拉特分布
- Gompertz(截断Gumbel)分布
- Gumbel(LogWeibull,Fisher-Tippetts,I型极值)分布
- Gumbel左偏(最小顺序统计量)分布
- 半柯西分布
- 半正态分布
- 半Logistic分布
- 双曲正割分布
- 高斯超几何分布
- 倒伽马分布
- 逆正态(逆高斯)分布
- 倒威布尔分布
- 约翰逊SB分布
- 约翰逊·苏分布
- KSONE分布
- KStwo分布
- KStwobign分布
- 拉普拉斯(双指数、双指数)分布
- 非对称拉普拉斯分布
- 左偏Lévy分布
- Lévy分布
- Logistic(二次方)分布
- 对数双指数(对数-拉普拉斯)分布
- 对数伽马分布
- 对数正态(柯布-道格拉斯)分布
- 对数均匀分布
- 麦克斯韦分布
- Mielke的Beta-Kappa分布
- 中上分布
- 非中心卡方分布
- 非中心F分布
- 非中心t分布
- 正态分布
- 正态逆高斯分布
- 帕累托分布
- 帕累托第二类(Lomax)分布
- 幂对数正态分布
- 功率正态分布
- 幂函数分布
- R分布分布
- 瑞利分布
- 大米分布
- 倒数高斯逆分布
- 半圆形分布
- 学院化范围分布
- 学生t分布
- 梯形分布
- 三角分布
- 截断指数分布
- 截断正态分布
- Tukey-Lambda分布
- 均匀分布
- 冯·米塞斯分布
- 沃尔德分布
- 威布尔最大极值分布
- 威布尔最小极值分布
- 包络柯西分布