统计函数 (scipy.stats
)¶
此模块包含大量的概率分布、汇总和频率统计、相关函数和统计测试、屏蔽统计、核密度估计、准蒙特卡罗功能等。
统计是一个非常大的领域,有一些主题超出了本网站的范围,并在其他软件包中涵盖。其中一些最重要的是:
statsmodels :回归、线性模型、时间序列分析、主题的扩展
scipy.stats
。Pandas :表格数据、时间序列功能、与其他统计语言的接口。
PyMC :贝叶斯统计建模,概率机器学习。
scikit-learn :分类、回归、模型选择。
Seaborn :统计数据可视化。
rpy2 :Python to R桥。
概率分布¶
Each univariate distribution is an instance of a subclass of rv_continuous
(rv_discrete
for discrete distributions):
|
用于子类化的通用连续随机变量类。 |
|
用于子类化的通用离散随机变量类。 |
|
生成由直方图给出的分布。 |
连续分布¶
一个阿尔法连续随机变量。 |
|
有角度的连续随机变量。 |
|
一个反正弦连续的随机变量。 |
|
阿格斯分布 |
|
贝塔连续随机变量。 |
|
贝塔素数连续随机变量。 |
|
布拉德福德连续随机变量。 |
|
Burr(III型)连续随机变量。 |
|
BURR(XII型)连续随机变量。 |
|
柯西连续型随机变量。 |
|
一个X连续型随机变量。 |
|
卡方连续随机变量。 |
|
余弦连续随机变量。 |
|
晶球分布 |
|
双伽马连续随机变量。 |
|
双威布尔连续随机变量。 |
|
一个Erlang连续随机变量。 |
|
指数连续型随机变量。 |
|
指数修正的正态连续随机变量。 |
|
威布尔指数连续型随机变量。 |
|
指数幂连续随机变量。 |
|
一个F连续的随机变量。 |
|
疲劳寿命(Birnbaum-Saunders)连续随机变量。 |
|
一个FISK连续随机变量。 |
|
一个折叠的柯西连续随机变量。 |
|
折叠的正态连续随机变量。 |
|
广义Logistic连续随机变量。 |
|
广义正态连续随机变量。 |
|
广义帕累托连续型随机变量。 |
|
广义指数连续型随机变量。 |
|
广义极值连续型随机变量。 |
|
一个高斯超几何连续随机变量。 |
|
伽马连续随机变量。 |
|
广义伽马连续随机变量。 |
|
一个广义半Logistic连续型随机变量。 |
|
广义双曲连续型随机变量。 |
|
一个广义逆高斯连续随机变量。 |
|
吉尔布拉特连续随机变量。 |
|
Gompertz(或截断的Gumbel)连续随机变量。 |
|
右斜Gumbel连续随机变量。 |
|
左偏Gumbel连续随机变量。 |
|
半柯西连续型随机变量。 |
|
半逻辑连续随机变量。 |
|
半正态连续随机变量。 |
|
广义正态连续随机变量的上半部分。 |
|
双曲正割连续型随机变量。 |
|
一个倒置的伽马连续随机变量。 |
|
逆高斯连续随机变量。 |
|
一个倒置的威布尔连续随机变量。 |
|
约翰逊SB连续随机变量。 |
|
一个Johnson-Su连续随机变量。 |
|
Kappa 4参数分布。 |
|
Kappa 3参数分布。 |
|
Kolmogorov-Smirnov单边检验统计分布。 |
|
Kolmogorov-Smirnov双侧检验统计分布。 |
|
刻度Kolmogorov-Smirnov双侧检验统计量的极限分布。 |
|
拉普拉斯连续随机变量。 |
|
一个不对称的拉普拉斯连续随机变量。 |
|
利维连续随机变量。 |
|
一个左偏Levy连续随机变量。 |
|
一个Levy稳定的连续随机变量。 |
|
逻辑(或二次方)连续随机变量。 |
|
对数伽马连续随机变量。 |
|
一个对数拉普拉斯连续型随机变量。 |
|
对数正态连续随机变量。 |
|
对数均匀或倒数连续的随机变量。 |
|
Lomax(第二类帕累托)连续随机变量。 |
|
麦克斯韦连续随机变量。 |
|
一个Mielke Beta-Kappa/Dagum连续随机变量。 |
|
莫亚尔连续随机变量。 |
|
一个Nakagami连续型随机变量。 |
|
一个非中心卡方连续型随机变量。 |
|
非中心F分布连续型随机变量。 |
|
一个非中心学生t连续型随机变量。 |
|
正态连续随机变量。 |
|
正态逆高斯连续随机变量。 |
|
帕累托连续随机变量。 |
|
皮尔逊III型连续随机变量。 |
|
幂函数连续随机变量。 |
|
幂对数正态连续随机变量。 |
|
幂正态连续随机变量。 |
|
R分布(对称β)连续随机变量。 |
|
瑞利连续随机变量。 |
|
一个Rice连续型随机变量。 |
|
一个倒数逆高斯连续随机变量。 |
|
半圆形连续随机变量。 |
|
一个倾斜的柯西随机变量。 |
|
一个偏态正态随机变量。 |
|
一个学生化的范围连续的随机变量。 |
|
学生t连续型随机变量。 |
|
梯形连续随机变量。 |
|
三角形连续随机变量。 |
|
截断的指数连续随机变量。 |
|
截断的正态连续随机变量。 |
|
一个Tukey-Lamdba连续随机变量。 |
|
均匀连续的随机变量。 |
|
一个冯·米塞斯连续型随机变量。 |
|
一个冯·米塞斯连续型随机变量。 |
|
沃尔德连续随机变量。 |
|
威布尔最小连续随机变量。 |
|
威布尔最大连续随机变量。 |
|
一个包裹的柯西连续型随机变量。 |
多元分布¶
多变量正态随机变量。 |
|
矩阵正态随机变量。 |
|
狄利克莱特随机变量。 |
|
一个Wishart随机变量。 |
|
逆Wishart随机变量。 |
|
多项式随机变量。 |
|
矩阵值SO(N)随机变量。 |
|
矩阵值O(N)随机变量。 |
|
矩阵值U(N)随机变量。 |
|
随机相关矩阵。 |
|
多元t分布随机变量。 |
|
多变量超几何随机变量。 |
离散分布¶
伯努利离散随机变量。 |
|
贝塔二项离散随机变量。 |
|
二项离散随机变量。 |
|
波尔兹曼(截断离散指数)随机变量。 |
|
拉普拉斯离散随机变量。 |
|
几何离散随机变量。 |
|
超几何离散随机变量。 |
|
对数(对数系列、系列)离散随机变量。 |
|
负二项离散随机变量。 |
|
一个费舍尔非中心超几何离散随机变量。 |
|
一个Wallenius的非中心超几何离散随机变量。 |
|
负的超几何离散随机变量。 |
|
普朗克离散指数随机变量。 |
|
泊松离散随机变量。 |
|
均匀的离散随机变量。 |
|
一个Skellam离散随机变量。 |
|
一个Yule-Simon离散随机变量。 |
|
Zipf(Zeta)离散随机变量。 |
|
Zipfian离散随机变量。 |
下面给出统计函数的概述。其中许多函数在 scipy.stats.mstats
其适用于掩蔽阵列。
汇总统计信息¶
|
计算传递的数组的几个描述性统计信息。 |
|
计算沿指定轴的几何平均值。 |
|
计算沿指定轴的调和平均值。 |
|
计算数据集的峰度(Fisher或Pearson)。 |
|
在传递的数组中返回模式值(最常见)的数组。 |
|
计算样本平均值的n阶矩。 |
|
计算数据集的样本偏斜度。 |
|
返回第n个k-统计量(到目前为止,1<=n<=4)。 |
|
返回k统计量方差的无偏估计。 |
|
计算修剪后的平均值。 |
|
计算修剪后的方差。 |
|
计算修剪后的最小值。 |
|
计算修剪后的最大值。 |
|
计算修剪后的样本标准偏差。 |
|
计算平均值的修剪标准误差。 |
|
计算变异系数。 |
|
查找重复次数和重复计数。 |
|
从两个尾部修剪分布后数组的返回平均值。 |
|
计算阵列的几何标准差。 |
|
计算沿指定轴的数据的四分位数范围。 |
|
计算平均值的标准误差。 |
|
均值、方差和标准差的贝叶斯置信区间。 |
|
数据的均值、方差和标准差的“冻结”分布。 |
|
计算给定概率值的分布的熵。 |
|
给定一个分布样本,估计微分熵。 |
|
|
|
计算数据沿给定轴的中位数绝对偏差。 |
|
计算统计量的双边Bootstrap置信区间。 |
频率统计¶
|
使用直方图函数返回累积频率直方图。 |
|
计算分数相对于分数列表的百分位排名。 |
|
计算输入序列中给定百分位的分数。 |
|
使用直方图函数返回相对频率直方图。 |
|
计算一组或多组数据的入库统计信息。 |
|
计算一组或多组数据的二维入库统计。 |
|
计算一组数据的多维入库统计。 |
相关函数¶
|
进行单因素方差分析。 |
|
执行亚历山大治理测试。 |
|
皮尔逊相关系数和p值用于检验不相关性。 |
|
计算具有相关p值的Spearman相关系数。 |
|
计算点的双列相关系数及其p值。 |
|
计算Kendall‘s tau,这是一种序数数据的相关性度量。 |
|
计算肯德尔公式的加权版本 \(\tau\) 。 |
|
计算萨默斯D,这是一种不对称的序数关联度量。 |
|
计算两组测量值的线性最小二乘回归。 |
|
计算一组点(x,y)的Siegel估计器。 |
|
计算一组点(x,y)的Theil-Sen估计量。 |
|
计算多尺度图形相关性(MGC)测试统计信息。 |
统计检验¶
|
计算一组分数平均值的T检验。 |
|
计算均数的T检验 两个独立的 分数样本。 |
|
描述性统计中两个独立样本均值的t检验。 |
|
计算分数的两个相关样本a和b的t检验。 |
|
计算单向卡方检验。 |
|
执行单样本Cramér-von Mises测试以确定拟合优度。 |
|
执行两个样本的Cramér-von Mises拟合优度测试。 |
|
Cressie-Read功率散度统计和拟合优度检验。 |
|
执行(单样本或双样本)Kolmogorov-Smirnov拟合优度检验。 |
|
对拟合优度执行单样本Kolmogorov-Smirnov检验。 |
|
执行双样本Kolmogorov-Smirnov拟合优度检验。 |
|
计算Epps-Singleton(ES)检验统计量。 |
|
对两个独立样本进行Mann-Whitney U秩检验。 |
|
Mann-Whitney U和Kruskal-Wallis H试验的平局修正因子。 |
|
给数据分配等级,适当地处理关系。 |
|
计算两个样本的Wilcoxon秩和统计量。 |
|
计算Wilcoxon符号秩检验。 |
|
计算独立样本的Kruskal-Wallis H检验。 |
|
计算重复测量的弗里德曼检验。 |
|
计算样本x和y的Brunner-Munzel检验。 |
|
合并来自独立测试的p值,这些p值与相同的假设有关。 |
|
对样本数据进行Jarque-Bera拟合优度检验。 |
|
执行佩奇测试,这是一种测量治疗之间观察趋势的方法。 |
|
执行Tukey‘s HSD测试,以确定多种治疗方法的均数相等。 |
|
对同等刻度参数执行Ansari-Bradley测试。 |
|
进行Bartlett‘s检验,以确定是否有相等的方差。 |
|
执行等方差的Levene检验。 |
|
对正态性进行夏皮罗-威尔克检验。 |
|
对来自特定分布的数据进行安德森-达林检验。 |
|
k样本的Anderson-Darling检验。 |
|
执行成功概率为p的测试。 |
|
执行成功概率为p的测试。 |
|
对方差相等进行Fligner-Killeen检验。 |
|
进行情绪的中位数测试。 |
|
对等尺度参数进行Mod‘s检验。 |
|
检验偏差是否不同于正态分布。 |
|
测试数据集是否具有正常峰度。 |
|
检验样本是否不同于正态分布。 |
拟蒙特卡罗¶
屏蔽统计函数¶
- 掩蔽阵列的统计函数 (
scipy.stats.mstats
)- 汇总统计信息
- scipy.stats.mstats.describe
- scipy.stats.mstats.gmean
- scipy.stats.mstats.hmean
- scipy.stats.mstats.kurtosis
- scipy.stats.mstats.mode
- scipy.stats.mstats.mquantiles
- scipy.stats.mstats.hdmedian
- scipy.stats.mstats.hdquantiles
- scipy.stats.mstats.hdquantiles_sd
- scipy.stats.mstats.idealfourths
- scipy.stats.mstats.plotting_positions
- scipy.stats.mstats.meppf
- scipy.stats.mstats.moment
- scipy.stats.mstats.skew
- scipy.stats.mstats.tmean
- scipy.stats.mstats.tvar
- scipy.stats.mstats.tmin
- scipy.stats.mstats.tmax
- scipy.stats.mstats.tsem
- scipy.stats.mstats.variation
- scipy.stats.mstats.find_repeats
- scipy.stats.mstats.sem
- scipy.stats.mstats.trimmed_mean
- scipy.stats.mstats.trimmed_mean_ci
- scipy.stats.mstats.trimmed_std
- scipy.stats.mstats.trimmed_var
- 频率统计
- 相关函数
- scipy.stats.mstats.f_oneway
- scipy.stats.mstats.pearsonr
- scipy.stats.mstats.spearmanr
- scipy.stats.mstats.pointbiserialr
- scipy.stats.mstats.kendalltau
- scipy.stats.mstats.kendalltau_seasonal
- scipy.stats.mstats.linregress
- scipy.stats.mstats.siegelslopes
- scipy.stats.mstats.theilslopes
- scipy.stats.mstats.sen_seasonal_slopes
- 统计检验
- scipy.stats.mstats.ttest_1samp
- scipy.stats.mstats.ttest_onesamp
- scipy.stats.mstats.ttest_ind
- scipy.stats.mstats.ttest_rel
- scipy.stats.mstats.chisquare
- scipy.stats.mstats.kstest
- scipy.stats.mstats.ks_2samp
- scipy.stats.mstats.ks_1samp
- scipy.stats.mstats.ks_twosamp
- scipy.stats.mstats.mannwhitneyu
- scipy.stats.mstats.rankdata
- scipy.stats.mstats.kruskal
- scipy.stats.mstats.kruskalwallis
- scipy.stats.mstats.friedmanchisquare
- scipy.stats.mstats.brunnermunzel
- scipy.stats.mstats.skewtest
- scipy.stats.mstats.kurtosistest
- scipy.stats.mstats.normaltest
- 变换
- 其他
- 汇总统计信息
其他统计功能¶
变换¶
|
返回由Box-Cox幂变换转换的数据集。 |
|
计算输入数据的最佳Box-Cox变换参数。 |
|
boxcox对数似然函数。 |
|
返回由Yeo-Johnson幂变换转换的数据集。 |
|
计算最佳的Yeo-Johnson变换参数。 |
|
yojohnson对数似然函数。 |
|
对输入数据(任意数量的数组)计算O‘Brien变换。 |
|
执行数组元素的迭代σ修剪。 |
|
从数组的两端切下一定比例的项。 |
|
从传递的数组分布的一端切下一定比例。 |
|
计算相对z得分。 |
|
计算z分数。 |
统计距离¶
|
计算两个一维分布之间的第一个Wasserstein距离。 |
|
计算两个一维分布之间的能量距离。 |
随机变量生成/CDF反演¶
|
使用均匀比方法从概率密度函数生成随机样本。 |
|
朴素的制服比(NROU)法。 |
|
概率分布的Hermite样条快速数值逆。 |
|
基于多项式插值的CDF反演(PINV) |
|
变换密度排斥(TDR)法。 |
|
离散别名-骨灰盒方法。 |
循环统计函数¶
|
计算某个范围内样本的循环平均值。 |
|
计算假设在某个范围内的样本的循环方差。 |
|
计算假设在该范围内的样本的圆形标准差 [从低到高] 。 |
列联表函数¶
|
列联表中变量独立性的卡方检验。 |
|
中每个可能的唯一组合的计数值的返回表。 |
|
根据列联表计算预期频率。 |
|
返回数组的边际和列表 a 。 |
|
计算相对风险(也称为风险比率)。 |
|
计算两个名义变量之间的关联度。 |
|
在2x2列联表上执行Fisher精确测试。 |
|
在2x2列联表上执行Barnard精确测试。 |
|
在2x2列联表上执行Boschloo的精确测试。 |
情节测试¶
|
计算使PPCC最大化的形状参数。 |
|
计算并根据需要绘制概率图相关系数。 |
|
计算概率图的分位数,并根据需要显示该图。 |
|
计算Box-Cox正态图的参数,可以选择显示它。 |
|
计算YEO-JONSON正态图的参数,有选择地显示它。 |
单变量和多变量核密度估计¶
|
用高斯核表示核密度估计。 |
中使用的警告/错误 scipy.stats
¶
|
警告生成者 |
警告生成者 |
|
|
警告生成者 |
|
警告生成者 |
|
警告生成者 |
当UNU.RAN库中发生错误时引发。 |