正常化#
- sklearn.preprocessing.normalize(X, norm='l2', *, axis=1, copy=True, return_norm=False)[源代码]#
Scale input vectors individually to unit norm (vector length).
阅读更多的 User Guide .
- 参数:
- X形状(n_samples,n_features)的{类数组,稀疏矩阵}
要规范化的数据,逐个元素。scipy.sparse矩阵应采用CSR格式,以避免不必要的复制。
- norm' l1 ',',' max ',默认=' l2 '
用于规范化每个非零样本(或每个非零特征,如果轴为0)的规范。
- axis{0,1},默认=1
定义用于规范化数据的轴。如果为1,则独立规范化每个样本,否则(如果为0)规范化每个特征。
- copy布尔,默认=True
如果为False,请尝试避免复制并进行适当的规范化。并不能保证这始终有效;例如,如果数据是具有int dype的numpy数组,即使具有Copy=False,也会返回副本。
- return_norm布尔,默认=假
是否返回计算出的规范。
- 返回:
- X{ndarray,sparse matrix}的形状(n_samples,n_features)
标准化输入X。
- norms如果轴=1,则形状的nd数组(n_samples,)否则(n_features,)
沿着X的给定轴的一系列规范。当X是稀疏的时,将为规范“l1”或“l2”引发NotImplementedRight。
参见
Normalizer
使用Transformer API执行规范化(例如,作为预处理的一部分
Pipeline
).
注意到
有关不同缩放器、转换器和规范器的比较,请参阅: 比较不同缩放器对数据的影响与离群值 .
示例
>>> from sklearn.preprocessing import normalize >>> X = [[-2, 1, 2], [-1, 0, 1]] >>> normalize(X, norm="l1") # L1 normalization each row independently array([[-0.4, 0.2, 0.4], [-0.5, 0. , 0.5]]) >>> normalize(X, norm="l2") # L2 normalization each row independently array([[-0.66..., 0.33..., 0.66...], [-0.70..., 0. , 0.70...]])