层次聚类 (scipy.cluster.hierarchy )

这些函数通过提供每个观测的平面聚类ID,将分层聚类分割成平面聚类,或者找到由切割形成的森林的根。

fcluster \(Z,t[, criterion, depth, R, monocrit] )

从由给定链接矩阵定义的分层聚类形成扁平聚类。

fclusterdata \(X,t[, criterion, metric, ...] )

使用给定的度量对观测数据进行聚类。

leaders \(Z,T)

返回分层群集中的根节点。

这些是聚集群集的例程。

linkage \(y[, method, metric, optimal_ordering] )

执行分层/聚集群集。

single \(y)

在压缩距离矩阵上执行单/最小/最近链接 y

complete \(y)

在压缩距离矩阵上执行完整/最大/最远点链接。

average \(y)

在压缩距离矩阵上执行Average/UPGMA链接。

weighted \(y)

对压缩距离矩阵执行加权/WPGMA链接。

centroid \(y)

执行质心/UPGMC联动。

median \(y)

执行中间带/WPGMC连接。

ward \(y)

在压缩距离矩阵上执行Ward链接。

这些例程计算层次结构的统计信息。

cophenet \(Z[, Y] )

计算由链接定义的层次聚类中的每个观察点之间的共生距离 Z

from_mlab_linkage \(Z)

将由MATLAB(TM)生成的链接矩阵转换为与该模块兼容的新链接矩阵。

inconsistent \(Z[, d] )

计算链接矩阵上的不一致性统计信息。

maxinconsts \(Z,R)

返回每个非单例群集及其子群集的最大不一致系数。

maxdists \(Z)

返回任何非单一群集之间的最大距离。

maxRstat \(Z,R,I)

返回每个非单一群集及其子群集的最大统计信息。

to_mlab_linkage \(Z)

将链接矩阵转换为与MATLAB(TM)兼容的矩阵。

用于可视化平面群集的例程。

dendrogram \(Z[, p, truncate_mode, ...] )

将层次聚类绘制为树状图。

这些是用于将层次结构表示为树对象的数据结构和例程。

ClusterNode \(ID[, left, right, dist, count] )

用于表示群集的树节点类。

leaves_list \(Z)

返回叶节点ID列表。

to_tree \(Z[, rd] )

将链接矩阵转换为易于使用的树对象。

cut_tree \(Z[, n_clusters, height] )

在给定链接矩阵Z的情况下,返回切割后的树。

optimal_leaf_ordering \(Z,y[, metric] )

在给定链接矩阵Z和距离的情况下,对切割的树重新排序。

这些谓词用于检查链接和不一致矩阵的有效性,以及用于检查两个平面群集分配的同构。

is_valid_im \(r[, warning, throw, name] )

如果传递的不一致矩阵有效,则返回True。

is_valid_linkage \(Z[, warning, throw, name] )

检查链接矩阵的有效性。

is_isomorphic \(T1,T2)

确定两个不同的群集分配是否相等。

is_monotonic \(Z)

如果传递的链接是单调的,则返回True。

correspond \(Z,Y)

检查链接和压缩距离矩阵之间的对应关系。

num_obs_linkage \(Z)

返回传递的链接矩阵的原始观测数。

用于绘图的实用程序例程:

set_link_color_palette \(调色板)

设置树形图使用的matplotlib颜色代码列表。

实用程序类:

DisjointSet \([elements] )

增量连接查询的不相交集合数据结构。