二进制化#
- sklearn.preprocessing.binarize(X, *, threshold=0.0, copy=True)[源代码]#
类数组或scipy.稀疏矩阵的布尔阈值化。
阅读更多的 User Guide .
- 参数:
- X形状(n_samples,n_features)的{类数组,稀疏矩阵}
要二进制化的数据,逐个元素。scipy.sparse矩阵应采用CSR或CSC格式,以避免不必要的复制。
- thresholdfloat,默认=0.0
低于或等于该值的特征值将被0替换,高于该值的特征值将被1替换。对于稀疏矩阵上的操作,阈值不能小于0。
- copy布尔,默认=True
如果为假,请尝试避免副本并就地二进制化。并不能保证这始终有效;例如,如果数据是具有对象dype的numpy数组,则即使具有Copy=False,也会返回副本。
- 返回:
- X_tr{ndarray,sparse matrix}的形状(n_samples,n_features)
转换后的数据。
示例
>>> from sklearn.preprocessing import binarize >>> X = [[0.4, 0.6, 0.5], [0.6, 0.1, 0.2]] >>> binarize(X, threshold=0.5) array([[0., 1., 0.], [1., 0., 0.]])