sklearn.model_selection#

模型选择工具,例如交叉验证和超参数调优。

User guide. 看到 交叉验证:评估估计器性能 , 调整估计器的超参数 ,而且 学习曲线 部分了解更多详细信息。

分路器#

GroupKFold

具有非重叠组的K折叠迭代器变体。

GroupShuffleSplit

Shuffle-Group(s)-Out交叉验证迭代器。

KFold

K-Fold交叉验证器。

LeaveOneGroupOut

Leave One Group Out cross-validator.

LeaveOneOut

留一出交叉验证器。

LeavePGroupsOut

将P Group排除在外交叉验证器。

LeavePOut

Leave-P-Out交叉验证器。

PredefinedSplit

预定义的分割交叉验证程序。

RepeatedKFold

重复K折交叉验证器。

RepeatedStratifiedKFold

重复分层K折叠交叉验证器。

ShuffleSplit

随机排列交叉验证器。

StratifiedGroupKFold

分层K-Fold迭代器变体,具有非重叠组。

StratifiedKFold

分层K-Fold交叉验证器。

StratifiedShuffleSplit

分层ShuffleSplit交叉验证器。

TimeSeriesSplit

时间序列交叉验证器。

check_cv

用于构建交叉验证器的输入检查器实用程序。

train_test_split

将数组或矩阵拆分为随机训练和测试子集。

超参数优化器#

GridSearchCV

对估计器的指定参数值进行详尽搜索。

HalvingGridSearchCV

通过连续减半搜索指定的参数值。

HalvingRandomSearchCV

随机搜索超参数。

ParameterGrid

参数网格,每个参数都有离散数量的值。

ParameterSampler

从给定分布中采样的参数生成器。

RandomizedSearchCV

随机搜索超参数。

拟合后模型调整#

FixedThresholdClassifier

手动设置决策阈值的二元分类器。

TunedThresholdClassifierCV

使用交叉验证对决策阈值进行后调整的分类器。

模型验证#

cross_val_predict

Generate cross-validated estimates for each input data point.

cross_val_score

通过交叉验证评估分数。

cross_validate

通过交叉验证评估指标,并记录适合/评分时间。

learning_curve

学习曲线。

permutation_test_score

评估交叉验证评分与排列的显著性。

validation_curve

验证曲线。

可视化#

LearningCurveDisplay

学习曲线可视化。

ValidationCurveDisplay

验证曲线可视化。