skbio.diversity.alpha.gini_index¶
- skbio.diversity.alpha.gini_index(data, method='rectangles')[源代码]¶
计算基尼指数。
状态:从0.4.0开始实验。
基尼系数被定义为
\[G=\FRAC{A}{A+B}\]哪里 \(A\) 是介于 \(y=x\) 洛伦兹曲线和 \(B\) 是洛伦兹曲线下的面积。简化为 \(1-2B\) 自那以后 \(A+B=0.5\) 。
- 参数:
data (1-D array_like) -- 计数、丰度、比例等的向量。所有条目必须为非负数。
method ({'rectangles', 'trapezoids'}) -- 计算洛伦兹曲线下面积的方法。如果
'rectangles'
通过平行于x轴的直线连接Lorenz曲线点。这是正确的方法(在我们看来)。'trapezoids'
在某些情况下可能是可取的。如果'trapezoids'
通过Lorenz曲线点之间的线性线段将它们连接起来。基本上假设给定的采样是准确的,并且给定数据的更多特征将落在该数据的值之间的线性梯度上。
- 返回:
基尼系数。
- 返回类型:
double
- 抛出:
ValueError -- 如果 method 不是计算曲线下面积的受支持方法之一。
备注
基尼系数是在#年引入的。 [1]. 的公式
method='rectangles'
是\[Dx\sum_{i=1}^n h_i\]的公式
method='trapezoids'
是\[Dx(\frac{h_0+h_n}{2}+\sum_{i=1}^{n-1}h_i)\]引用