掩蔽阵列的统计函数 (scipy.stats.mstats )

此模块包含大量可用于掩码数组的统计函数。

这些函数中的大多数与中的函数相似 scipy.stats 但是在API或使用的算法上可能有很小的差异。由于这是一个相对较新的包,因此仍有可能对API进行一些更改。

汇总统计信息

describe \(a[, axis, ddof, bias] )

计算传递的数组的多个描述性统计信息。

gmean \(a[, axis, dtype, weights] )

计算沿指定轴的几何平均值。

hmean \(a[, axis, dtype] )

计算沿指定轴的调和平均值。

kurtosis \(a[, axis, fisher, bias] )

计算数据集的峰度(Fisher或Pearson)。

mode \(a[, axis] )

返回传递的数组中的模态(最常见)值的数组。

mquantiles \(a[, prob, alphap, betap, axis, limit] )

计算数据数组的经验分位数。

hdmedian \(数据[, axis, var] )

返回沿给定轴的中位数的Harrell-Davis估计。

hdquantiles \(数据[, prob, axis, var] )

使用Harrell-Davis方法计算分位数估计。

hdquantiles_sd \(数据[, prob, axis] )

用折叠法估计哈雷尔-戴维斯分位数的标准误差。

idealfourths \(数据[, axis] )

返回低四分位数和高四分位数的估计值。

plotting_positions \(数据[, alpha, beta] )

返回数据的绘图位置(或经验百分位点)。

meppf \(数据[, alpha, beta] )

返回数据的绘图位置(或经验百分位点)。

moment \(a[, moment, axis] )

计算样本关于平均值的n阶矩。

skew \(a[, axis, bias] )

计算数据集的偏斜度。

tmean \(a[, limits, inclusive, axis] )

计算修剪后的平均值。

tvar \(a[, limits, inclusive, axis, ddof] )

计算修剪后的方差

tmin \(a[, lowerlimit, axis, inclusive] )

计算修剪后的最小值

tmax \(a[, upperlimit, axis, inclusive] )

计算修剪后的最大值

tsem \(a[, limits, inclusive, axis, ddof] )

计算平均值的修剪标准误差。

variation \(a[, axis, ddof] )

计算变异系数。

find_repeats \(arr)

在arr中查找重复项并返回一个元组(REPEATES,REPEAT_COUNT)。

sem \(a[, axis, ddof] )

计算输入数组平均值的标准误差。

trimmed_mean \(a[, limits, inclusive, ...] )

返回数据沿给定轴的修剪平均值。

trimmed_mean_ci \(数据[, limits, inclusive, ...] )

修剪后的平均值沿给定轴的选定置信区间。

trimmed_std \(a[, limits, inclusive, ...] )

返回数据沿给定轴的修剪标准偏差。

trimmed_var \(a[, limits, inclusive, ...] )

返回数据沿给定轴的修剪方差。

频率统计

scoreatpercentile \(数据,每个[, limit, ...] )

在序列a的给定的‘per’百分位数处计算分数。

相关函数

f_oneway \(*参数)

执行单向方差分析,返回给定任意组数的F值和概率。

pearsonr \(X,y)

皮尔逊相关系数和p值用于检验不相关性。

spearmanr \(X[, y, use_ties, axis, ...] )

计算Spearman秩相关系数和p值以测试非相关性。

pointbiserialr \(X,y)

计算点的双序相关系数及其p值。

kendalltau \(X,y[, use_ties, use_missing, ...] )

在两个变量上计算Kendall的秩相关τ xy

kendalltau_seasonal \(X)

计算季节性数据的多变量Kendall秩相关τ。

linregress \(X[, y] )

线性回归计算

siegelslopes \(y[, x, method] )

计算一组点(x,y)的Siegel估计器。

theilslopes \(y[, x, alpha, method] )

计算一组点(x,y)的Theil-Sen估计量。

sen_seasonal_slopes \(X)

统计检验

ttest_1samp \(a,popmeans[, axis, alternative] )

计算一组分数的平均值的T检验。

ttest_onesamp \(a,popmeans[, axis, alternative] )

计算一组分数的平均值的T检验。

ttest_ind \(a,b[, axis, equal_var, alternative] )

计算两个独立分数样本的平均数的T检验。

ttest_rel \(a,b[, axis, alternative] )

对分数的两个相关样本a和b计算T检验。

chisquare \(F_OBS[, f_exp, ddof, axis] )

计算单向卡方检验。

kstest \(data1,data2[, args, alternative, mode] )

参数

ks_2samp \(data1,data2[, alternative, mode] )

对两个样本计算Kolmogorov-Smirnov检验。

ks_1samp \(X,CDF[, args, alternative, mode] )

对一个掩码值样本计算Kolmogorov-Smirnov测试。

ks_twosamp \(data1,data2[, alternative, mode] )

对两个样本计算Kolmogorov-Smirnov检验。

mannwhitneyu \(X,y[, use_continuity] )

计算Mann-Whitney统计量

rankdata \(数据[, axis, use_missing] )

返回沿给定轴的每个数据点的秩(也称为顺序统计信息)。

kruskal \(*参数)

计算独立样本的Kruskal-Wallis H检验

kruskalwallis \(*参数)

计算独立样本的Kruskal-Wallis H检验

friedmanchisquare \(*参数)

弗里德曼卡方检验是一种非参数、单因素方差分析方法。

brunnermunzel \(X,y[, alternative, distribution] )

计算样本x和y的Brunner-Munzel检验。

skewtest \(a[, axis, alternative] )

测试偏差是否不同于正态分布。

kurtosistest \(a[, axis, alternative] )

测试数据集是否具有正常峰度

normaltest \(a[, axis] )

检验样本是否不同于正态分布。

变换

obrientransform \(*参数)

对输入数据(任意数量的列)计算转换。

trim \(a[, limits, inclusive, relative, axis] )

通过屏蔽某些给定限制之外的数据来裁剪数组。

trima \(a[, limits, inclusive] )

通过屏蔽某些给定限制之外的数据来裁剪数组。

trimmed_stde \(a[, limits, inclusive, axis] )

返回修剪后的平均值沿给定轴的标准误差。

trimr \(a[, limits, inclusive, axis] )

通过屏蔽两端的一定比例的数据来修剪数组。

trimtail \(数据[, proportiontocut, tail, ...] )

通过掩码一个尾部的值来修剪数据。

trimboth \(数据[, proportiontocut, inclusive, ...] )

修剪最小和最大的数据值。

winsorize \(a[, limits, inclusive, inplace, ...] )

返回输入数组的Winsorized版本。

zmap \(分数,比较[, axis, ddof, nan_policy] )

计算相对z得分。

zscore \(a[, axis, ddof, nan_policy] )

计算z分数。

其他

argstoarray \(*参数)

从一组序列构造一个二维数组。

count_tied_groups \(X[, use_missing] )

计算绑定的值的数量。

msign \(X)

返回x的符号,如果x被屏蔽,则返回0。

compare_medians_ms \(组1、组2[, axis] )

比较沿给定轴的两个独立组的中点。

median_cihs \(数据[, alpha, axis] )

计算数据中值的Alpha级别置信区间。

mjci \(数据[, prob, axis] )

返回数据的选定实验分位数的标准误差的Maritz-Jarrett估计器。

mquantiles_cimj \(数据[, prob, alpha, axis] )

使用Maritz-Jarrett估计器计算所选数据分位数的α置信区间。

rsh \(数据[, points] )

评估每个数据点的Rosenblatt移位直方图估计器。