sklearn.preprocessing#

缩放、居中、规范化、二进制化等方法。

User guide. 看到 预处理数据 部分了解更多详细信息。

Binarizer

根据阈值对数据进行二值化(将特征值设置为0或1)。

FunctionTransformer

从任意可调用对象构造Transformer。

KBinsDiscretizer

将连续数据放入时间间隔中。

KernelCenterer

将任意核矩阵置于中心 \(K\) .

LabelBinarizer

以one-vs-all的方式二进制化标签。

LabelEncoder

使用0和n_classes-1之间的值对目标标签进行编码。

MaxAbsScaler

按每个要素的最大绝对值缩放。

MinMaxScaler

通过将每个特征缩放到给定范围来变换特征。

MultiLabelBinarizer

在可迭代项和多标签格式之间转换。

Normalizer

将样本单独标准化至单位规范。

OneHotEncoder

将类别功能编码为一热数字数组。

OrdinalEncoder

将类别特征编码为一个整元数组。

PolynomialFeatures

生成多项和交互功能。

PowerTransformer

按特征应用幂变换以使数据更像高斯。

QuantileTransformer

使用分位数信息变换要素。

RobustScaler

使用对离群值具有鲁棒性的统计数据来缩放特征。

SplineTransformer

为特征生成一元B样条基。

StandardScaler

通过删除均值并缩放到单位方差来标准化特征。

TargetEncoder

用于回归和分类目标的目标编码器。

add_dummy_feature

使用额外的虚拟功能来增强数据集。

binarize

类数组或scipy.稀疏矩阵的布尔阈值化。

label_binarize

以one-vs-all的方式二进制化标签。

maxabs_scale

将每个功能扩展到 [-1, 1] 范围而不破坏稀疏性。

minmax_scale

通过将每个特征缩放到给定范围来变换特征。

normalize

Scale input vectors individually to unit norm (vector length).

power_transform

参数单调变换使数据更加类似高斯。

quantile_transform

使用分位数信息变换要素。

robust_scale

标准化沿着任何轴的数据集。

scale

标准化沿着任何轴的数据集。