skbio.diversity.alpha.gini_index

skbio.diversity.alpha.gini_index(data, method='rectangles')[源代码]

计算基尼指数。

状态:从0.4.0开始实验。

基尼系数被定义为

\[G=\FRAC{A}{A+B}\]

哪里 \(A\) 是介于 \(y=x\) 洛伦兹曲线和 \(B\) 是洛伦兹曲线下的面积。简化为 \(1-2B\) 自那以后 \(A+B=0.5\)

参数:
  • data (1-D array_like) -- 计数、丰度、比例等的向量。所有条目必须为非负数。

  • method ({'rectangles', 'trapezoids'}) -- 计算洛伦兹曲线下面积的方法。如果 'rectangles' 通过平行于x轴的直线连接Lorenz曲线点。这是正确的方法(在我们看来)。 'trapezoids' 在某些情况下可能是可取的。如果 'trapezoids' 通过Lorenz曲线点之间的线性线段将它们连接起来。基本上假设给定的采样是准确的,并且给定数据的更多特征将落在该数据的值之间的线性梯度上。

返回:

基尼系数。

返回类型:

double

抛出:

ValueError -- 如果 method 不是计算曲线下面积的受支持方法之一。

备注

基尼系数是在#年引入的。 [1]. 的公式 method='rectangles'

\[Dx\sum_{i=1}^n h_i\]

的公式 method='trapezoids'

\[Dx(\frac{h_0+h_n}{2}+\sum_{i=1}^{n-1}h_i)\]

引用