正常化#

sklearn.preprocessing.normalize(X, norm='l2', *, axis=1, copy=True, return_norm=False)[源代码]#

Scale input vectors individually to unit norm (vector length).

阅读更多的 User Guide .

参数:

X形状（n_samples，n_features）的{类数组，稀疏矩阵}: 要规范化的数据，逐个元素。scipy.sparse矩阵应采用CSR格式，以避免不必要的复制。
norm' l1 '，'，' max '，默认=' l2 ': 用于规范化每个非零样本（或每个非零特征，如果轴为0）的规范。
axis{0，1}，默认=1: 定义用于规范化数据的轴。如果为1，则独立规范化每个样本，否则（如果为0）规范化每个特征。
copy布尔，默认=True: 如果为False，请尝试避免复制并进行适当的规范化。并不能保证这始终有效;例如，如果数据是具有int dype的numpy数组，即使具有Copy=False，也会返回副本。
return_norm布尔，默认=假: 是否返回计算出的规范。

返回:

X{ndarray，sparse matrix}的形状（n_samples，n_features）: 标准化输入X。
norms如果轴=1，则形状的nd数组（n_samples，）否则（n_features，）: 沿着X的给定轴的一系列规范。当X是稀疏的时，将为规范“l1”或“l2”引发NotImplementedRight。

参见

Normalizer: 使用Transformer API执行规范化（例如，作为预处理的一部分 Pipeline ).

注意到

有关不同缩放器、转换器和规范器的比较，请参阅：比较不同缩放器对数据的影响与离群值 .

示例

>>> from sklearn.preprocessing import normalize
>>> X = [[-2, 1, 2], [-1, 0, 1]]
>>> normalize(X, norm="l1")  # L1 normalization each row independently
array([[-0.4,  0.2,  0.4],
       [-0.5,  0. ,  0.5]])
>>> normalize(X, norm="l2")  # L2 normalization each row independently
array([[-0.66...,  0.33...,  0.66...],
       [-0.70...,  0.     ,  0.70...]])