scipy.cluster.hierarchy.is_valid_im

scipy.cluster.hierarchy.is_valid_im(R, warning=False, throw=False, name=None)[源代码]

如果传递的不一致矩阵有效,则返回True。

它一定是一个 \(n\) 乘以4个双精度数组。标准差 R[:,1] 必须是非负的。链接计数 R[:,2] 必须为正且不大于 \(n-1\)

参数
Rndarray

检查有效性的不一致矩阵。

warning布尔值,可选

为True时,如果传递的链接矩阵无效,则发出Python警告。

throw布尔值,可选

为True时,如果传递的链接矩阵无效,则引发Python异常。

name字符串,可选

此字符串引用无效链接矩阵的变量名。

退货
b布尔尔

如果不一致矩阵有效,则为True。

参见

linkage

有关链接矩阵是什么的说明,请参阅。

inconsistent

用于创建不一致矩阵。

示例

>>> from scipy.cluster.hierarchy import ward, inconsistent, is_valid_im
>>> from scipy.spatial.distance import pdist

给定一个数据集 X ,我们可以应用聚类方法来获得链接矩阵 Zscipy.cluster.hierarchy.inconsistent 也可以用来获得不一致矩阵 R 与此群集进程关联:

>>> X = [[0, 0], [0, 1], [1, 0],
...      [0, 4], [0, 3], [1, 4],
...      [4, 0], [3, 0], [4, 1],
...      [4, 4], [3, 4], [4, 3]]
>>> Z = ward(pdist(X))
>>> R = inconsistent(Z)
>>> Z
array([[ 0.        ,  1.        ,  1.        ,  2.        ],
       [ 3.        ,  4.        ,  1.        ,  2.        ],
       [ 6.        ,  7.        ,  1.        ,  2.        ],
       [ 9.        , 10.        ,  1.        ,  2.        ],
       [ 2.        , 12.        ,  1.29099445,  3.        ],
       [ 5.        , 13.        ,  1.29099445,  3.        ],
       [ 8.        , 14.        ,  1.29099445,  3.        ],
       [11.        , 15.        ,  1.29099445,  3.        ],
       [16.        , 17.        ,  5.77350269,  6.        ],
       [18.        , 19.        ,  5.77350269,  6.        ],
       [20.        , 21.        ,  8.16496581, 12.        ]])
>>> R
array([[1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.        , 0.        , 1.        , 0.        ],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [1.14549722, 0.20576415, 2.        , 0.70710678],
       [2.78516386, 2.58797734, 3.        , 1.15470054],
       [2.78516386, 2.58797734, 3.        , 1.15470054],
       [6.57065706, 1.38071187, 3.        , 1.15470054]])

现在我们可以使用 scipy.cluster.hierarchy.is_valid_im 要验证这一点,请执行以下操作 R 是否正确:

>>> is_valid_im(R)
True

但是,如果 R 如果构造错误(例如,其中一个标准差设置为负值),则检查将失败:

>>> R[-1,1] = R[-1,1] * -1
>>> is_valid_im(R)
False