make_checkerboard#
- sklearn.datasets.make_checkerboard(shape, n_clusters, *, noise=0.0, minval=10, maxval=100, shuffle=True, random_state=None)[源代码]#
生成具有块棋盘结构的数组以进行双集群化。
阅读更多的 User Guide .
- 参数:
- shape形状的多元组(n_rows,n_RST)
结果的形状。
- n_clustersint或类数组或形状(n_row_clusters,n_line_clusters)
行和列集群的数量。
- noisefloat,默认=0.0
高斯噪音的标准差。
- minvalfloat,默认=10
双簇的最小值。
- maxval浮动,默认=100
双簇的最大值。
- shuffle布尔,默认=True
洗牌样本。
- random_stateint,RandomState实例或无,默认=无
确定创建数据集的随机数生成。传递int以获得跨多个函数调用的可重复输出。看到 Glossary .
- 返回:
- X :nd形状数组
shape
形状数组 生成的数组。
- rows形状的nd数组(n_clusters,X.shape [0] )
各行的集群成员资格指标。
- cols形状的nd数组(n_clusters,X.shape [1] )
各列的集群成员资格指标。
- X :nd形状数组
参见
make_biclusters
生成具有恒定块对角线结构的数组以进行双集群化。
引用
[1]克鲁格,Y.,巴斯里,R.,张,JT,& Gerstein,M.(2003)。微阵列数据的光谱二聚群:基因和条件的共聚群。基因组研究,13(4),703-716。
示例
>>> from sklearn.datasets import make_checkerboard >>> data, rows, columns = make_checkerboard(shape=(300, 300), n_clusters=10, ... random_state=42) >>> data.shape (300, 300) >>> rows.shape (100, 300) >>> columns.shape (100, 300) >>> print(rows[0][:5], columns[0][:5]) [False False False True False] [False False False False False]