7. 数据集转换#
scikit-learn提供了一个transformers库,它可以清理(请参阅 预处理数据 )、减少(请参阅 无监督降维 ),扩展(请参阅 核近似 )或生成(请参阅 特征提取 )特征表示。
与其他估计器一样,这些估计器由具有a的类表示 fit
从训练集中学习模型参数(例如用于标准化的均值和标准差)的方法,以及 transform
将此转换模型应用于不可见数据的方法。 fit_transform
可以更方便、更有效地同时对训练数据进行建模和转换。
中涵盖了以并行或串联方式组合此类变压器 管道和复合估计量 . 成对指标、亲和力和核心 涵盖了将特征空间转换为亲和矩阵, 转换预测目标 (y ) 考虑在scikit-learn中使用的目标空间(例如类别标签)的转换。