正常化#

sklearn.preprocessing.normalize(X, norm='l2', *, axis=1, copy=True, return_norm=False)[源代码]#

Scale input vectors individually to unit norm (vector length).

阅读更多的 User Guide .

参数:
X形状(n_samples,n_features)的{类数组,稀疏矩阵}

要规范化的数据,逐个元素。scipy.sparse矩阵应采用CSR格式,以避免不必要的复制。

norm' l1 ',',' max ',默认=' l2 '

用于规范化每个非零样本(或每个非零特征,如果轴为0)的规范。

axis{0,1},默认=1

定义用于规范化数据的轴。如果为1,则独立规范化每个样本,否则(如果为0)规范化每个特征。

copy布尔,默认=True

如果为False,请尝试避免复制并进行适当的规范化。并不能保证这始终有效;例如,如果数据是具有int dype的numpy数组,即使具有Copy=False,也会返回副本。

return_norm布尔,默认=假

是否返回计算出的规范。

返回:
X{ndarray,sparse matrix}的形状(n_samples,n_features)

标准化输入X。

norms如果轴=1,则形状的nd数组(n_samples,)否则(n_features,)

沿着X的给定轴的一系列规范。当X是稀疏的时,将为规范“l1”或“l2”引发NotImplementedRight。

参见

Normalizer

使用Transformer API执行规范化(例如,作为预处理的一部分 Pipeline ).

注意到

有关不同缩放器、转换器和规范器的比较,请参阅: 比较不同缩放器对数据的影响与离群值 .

示例

>>> from sklearn.preprocessing import normalize
>>> X = [[-2, 1, 2], [-1, 0, 1]]
>>> normalize(X, norm="l1")  # L1 normalization each row independently
array([[-0.4,  0.2,  0.4],
       [-0.5,  0. ,  0.5]])
>>> normalize(X, norm="l2")  # L2 normalization each row independently
array([[-0.66...,  0.33...,  0.66...],
       [-0.70...,  0.     ,  0.70...]])