make_checkerboard#

sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[源代码]#

生成具有块棋盘结构的数组以进行双集群化。

阅读更多的 User Guide .

参数:
shape形状的多元组(n_rows,n_RST)

结果的形状。

n_clustersint或类数组或形状(n_row_clusters,n_line_clusters)

行和列集群的数量。

noisefloat,默认=0.0

高斯噪音的标准差。

minvalfloat,默认=10

双簇的最小值。

maxval浮动,默认=100

双簇的最大值。

shuffle布尔,默认=True

洗牌样本。

random_stateint,RandomState实例或无,默认=无

确定创建数据集的随机数生成。传递int以获得跨多个函数调用的可重复输出。看到 Glossary .

返回:
X :nd形状数组 shape形状数组

生成的数组。

rows形状的nd数组(n_clusters,X.shape [0] )

各行的集群成员资格指标。

cols形状的nd数组(n_clusters,X.shape [1] )

各列的集群成员资格指标。

参见

make_biclusters

生成具有恒定块对角线结构的数组以进行双集群化。

引用

[1]

克鲁格,Y.,巴斯里,R.,张,JT,& Gerstein,M.(2003)。微阵列数据的光谱二聚群:基因和条件的共聚群。基因组研究,13(4),703-716。

示例

>>> from sklearn.datasets import make_checkerboard
>>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10,
...                                         random_state=42)
>>> data.shape
(300, 300)
>>> rows.shape
(100, 300)
>>> columns.shape
(100, 300)
>>> print(rows[0][:5], columns[0][:5])
[False False False  True False] [False False False False False]