sklearn.preprocessing#
缩放、居中、规范化、二进制化等方法。
User guide. 看到 预处理数据 部分了解更多详细信息。
根据阈值对数据进行二值化(将特征值设置为0或1)。 |
|
从任意可调用对象构造Transformer。 |
|
将连续数据放入时间间隔中。 |
|
将任意核矩阵置于中心 \(K\) . |
|
以one-vs-all的方式二进制化标签。 |
|
使用0和n_classes-1之间的值对目标标签进行编码。 |
|
按每个要素的最大绝对值缩放。 |
|
通过将每个特征缩放到给定范围来变换特征。 |
|
在可迭代项和多标签格式之间转换。 |
|
将样本单独标准化至单位规范。 |
|
将类别功能编码为一热数字数组。 |
|
将类别特征编码为一个整元数组。 |
|
生成多项和交互功能。 |
|
按特征应用幂变换以使数据更像高斯。 |
|
使用分位数信息变换要素。 |
|
使用对离群值具有鲁棒性的统计数据来缩放特征。 |
|
为特征生成一元B样条基。 |
|
通过删除均值并缩放到单位方差来标准化特征。 |
|
用于回归和分类目标的目标编码器。 |
|
使用额外的虚拟功能来增强数据集。 |
|
类数组或scipy.稀疏矩阵的布尔阈值化。 |
|
以one-vs-all的方式二进制化标签。 |
|
将每个功能扩展到 [-1, 1] 范围而不破坏稀疏性。 |
|
通过将每个特征缩放到给定范围来变换特征。 |
|
Scale input vectors individually to unit norm (vector length). |
|
参数单调变换使数据更加类似高斯。 |
|
使用分位数信息变换要素。 |
|
标准化沿着任何轴的数据集。 |
|
标准化沿着任何轴的数据集。 |