二进制化#

sklearn.preprocessing.binarize(X, *, threshold=0.0, copy=True)[源代码]#

类数组或scipy.稀疏矩阵的布尔阈值化。

阅读更多的 User Guide .

参数:
X形状(n_samples,n_features)的{类数组,稀疏矩阵}

要二进制化的数据,逐个元素。scipy.sparse矩阵应采用CSR或CSC格式,以避免不必要的复制。

thresholdfloat,默认=0.0

低于或等于该值的特征值将被0替换,高于该值的特征值将被1替换。对于稀疏矩阵上的操作,阈值不能小于0。

copy布尔,默认=True

如果为假,请尝试避免副本并就地二进制化。并不能保证这始终有效;例如,如果数据是具有对象dype的numpy数组,则即使具有Copy=False,也会返回副本。

返回:
X_tr{ndarray,sparse matrix}的形状(n_samples,n_features)

转换后的数据。

参见

Binarizer

使用Transformer API执行二进制化(例如,作为预处理的一部分 Pipeline ).

示例

>>> from sklearn.preprocessing import binarize
>>> X = [[0.4, 0.6, 0.5], [0.6, 0.1, 0.2]]
>>> binarize(X, threshold=0.5)
array([[0., 1., 0.],
       [1., 0., 0.]])