API参考#

这是scikit-learn的类和功能参考。请参阅 full user guide 欲了解更多详细信息,因为类和函数的原始规范可能不足以为其使用提供完整的指导。有关API中重复的概念的参考,请参阅 常用术语和API元素词汇表 .

对象

描述

config_context

用于全球scikit-learn配置的上下文管理器。

get_config

设置的配置的当前值 set_config .

set_config

设置全局scikit-learn配置。

show_versions

打印有用的调试信息”

BaseEstimator

scikit-learn中所有估计器的基本类。

BiclusterMixin

scikit-learn中所有双聚类估计器的混合类。

ClassNamePrefixFeaturesOutMixin

Mixin类,用于通过添加后缀生成自己的名称的变形金刚。

ClassifierMixin

Scikit-learn中所有分类器的Mixin类。

ClusterMixin

scikit-learn中所有集群估计器的Mixin类。

DensityMixin

scikit-learn中所有密度估计器的Mixin类。

MetaEstimatorMixin

scikit-learn中所有Meta估计器的Mixin类。

OneToOneFeatureMixin

提供 get_feature_names_out 对于简单的变压器。

OutlierMixin

Scikit-learn中所有异常值检测估计器的Mixin类。

RegressorMixin

scikit-learn中所有回归估计器的Mixin类。

TransformerMixin

Scikit-learn中所有变形金刚的Mixin课程。

clone

用相同的参数构造一个新的非拟合估计量。

is_classifier

如果给定的估计器(可能)是分类器,则返回True。

is_clusterer

如果给定的估计器(可能)是集群器,则返回True。

is_regressor

如果给定的估计量(可能)是回归量,则返回True。

is_outlier_detector

如果给定的估计量(可能)是异常值检测器,则返回True。

CalibratedClassifierCV

使用等张回归或逻辑回归进行概率校准。

calibration_curve

计算校准曲线的真实概率和预测概率。

CalibrationDisplay

Calibration curve (also known as reliability diagram) visualization.

AffinityPropagation

执行数据的亲和力传播集群。

AgglomerativeClustering

集聚聚集。

Birch

实现BIRCH集群算法。

BisectingKMeans

二分K均值集群。

DBSCAN

根据向量数组或距离矩阵执行DBSCAN集群。

FeatureAgglomeration

聚集特征。

HDBSCAN

使用基于密度的分层集群对数据进行集群。

KMeans

K-Means聚类

MeanShift

使用平坦核的均值漂移集群。

MiniBatchKMeans

小批量K均值集群。

OPTICS

从载体数组估计集群结构。

SpectralBiclustering

光谱双集群化(Kluger,2003)。

SpectralClustering

将集群应用于规范化拉普拉斯的投影。

SpectralCoclustering

光谱共聚类算法(Dhillon,2001)。

affinity_propagation

执行数据的亲和力传播集群。

cluster_optics_dbscan

对任意收件箱执行DBSCAN提取。

cluster_optics_xi

根据Xi-steep方法自动提取集群。

compute_optics_graph

计算OPTICS可达性图。

dbscan

根据向量数组或距离矩阵执行DBSCAN集群。

estimate_bandwidth

估计均值漂移算法使用的带宽。

k_means

执行K-means集群算法。

kmeans_plusplus

Init n_根据k均值++对种子进行集群。

mean_shift

使用扁平核执行数据的均值漂移集群。

spectral_clustering

将集群应用于规范化拉普拉斯的投影。

ward_tree

基于特征矩阵的病房集群。

ColumnTransformer

将转换器复制到数组或pandas DataFrame的列。

TransformedTargetRegressor

元估计器在转换后的目标上进行回归。

make_column_selector

创建一个可调用文件来选择要使用的列

make_column_transformer

从给定的变压器构造一个列变形器。

EllipticEnvelope

用于检测高斯分布数据集中异常值的对象。

EmpiricalCovariance

最大似然协方差估计量。

GraphicalLasso

Sparse inverse covariance estimation with an l1-penalized estimator.

GraphicalLassoCV

稀疏逆协方差w/l1罚分的交叉验证选择。

LedoitWolf

LedoitWolf估计。

MinCovDet

最小协方差决定因素(MCB):协方差的稳健估计量。

OAS

Oracle近似收缩估计。

ShrunkCovariance

具有收缩的协方差估计量。

empirical_covariance

计算最大似然协方差估计量。

graphical_lasso

L1-惩罚协方差估计量。

ledoit_wolf

估计缩小的Ledoit-Wolf协方差矩阵。

ledoit_wolf_shrinkage

估计缩小的Ledoit-Wolf协方差矩阵。

oas

使用Oracle逼近收缩估计协方差。

shrunk_covariance

计算对角线上缩小的协方差矩阵。

CCA

典型相关分析,也称为“模式B”偏头痛。

PLSCanonical

偏最小平方Transformer和回归器。

PLSRegression

最大限度回归。

PLSSVD

部分最小平方奇异值。

clear_data_home

删除数据主缓存的所有内容。

dump_svmlight_file

以svmlight / libsvm文件格式转储数据集。

fetch_20newsgroups

从20个新闻组数据集加载文件名和数据(分类)。

fetch_20newsgroups_vectorized

加载并对20个新闻组数据集进行垂直化(分类)。

fetch_california_housing

加载加州住房数据集(回归)。

fetch_covtype

加载coverype数据集(分类)。

fetch_file

如果本地文件夹中尚未存在,请从Web获取该文件。

fetch_kddcup99

加载kddcup 99数据集(分类)。

fetch_lfw_pairs

加载Wild中的标签面孔(LFW)配对数据集(分类)。

fetch_lfw_people

加载野外标签面孔(LFW)人员数据集(分类)。

fetch_olivetti_faces

加载来自AT & T的Olivetti面部数据集(分类)。

fetch_openml

通过名称或数据集id从openml中获取数据集。

fetch_rcv1

加载RCV 1多标签数据集(分类)。

fetch_species_distributions

Phillips et.物种分布数据集的加载器。等人(2006)。

get_data_home

返回scikit-learn数据目录的路径。

load_breast_cancer

加载并返回乳腺癌wisspel数据集(分类)。

load_diabetes

加载并返回糖尿病数据集(回归)。

load_digits

加载并返回数字数据集(分类)。

load_files

加载将类别作为子文件夹名称的文本文件。

load_iris

加载并返回虹膜数据集(分类)。

load_linnerud

加载并返回体育锻炼Linnerud数据集。

load_sample_image

加载单个示例图像的numpy数组。

load_sample_images

加载示例图像以进行图像处理。

load_svmlight_file

将svmlight / libsvm格式的数据集加载到稀疏CSR矩阵中。

load_svmlight_files

以SVMlight格式从多个文件加载数据集。

load_wine

Load and return the wine dataset (classification).

make_biclusters

生成用于双集群的恒定块对角线结构阵列。

make_blobs

生成用于集群的各向同性高斯斑点。

make_checkerboard

生成具有块棋盘结构的数组以进行双集群化。

make_circles

在2D中创建一个包含一个较小圆的大圆。

make_classification

生成随机n级分类问题。

make_friedman1

生成“弗里德曼#1”回归问题。

make_friedman2

生成“弗里德曼#2”回归问题。

make_friedman3

生成“弗里德曼#3”回归问题。

make_gaussian_quantiles

生成各向同性高斯并通过分位数标记样本。

make_hastie_10_2

生成Hastie et al. 2009,Example 10.2中使用的二进制分类数据。

make_low_rank_matrix

生成一个具有钟形奇异值的基本上低阶矩阵。

make_moons

画两个交错的半圆。

make_multilabel_classification

生成随机多标签分类问题。

make_regression

生成随机回归问题。

make_s_curve

生成S曲线数据集。

make_sparse_coded_signal

Generate a signal as a sparse combination of dictionary elements.

make_sparse_spd_matrix

生成稀疏对称定正矩阵。

make_sparse_uncorrelated

使用稀疏不相关设计生成随机回归问题。

make_spd_matrix

生成一个随机对称、正定矩阵。

make_swiss_roll

生成瑞士卷数据集。

DictionaryLearning

字典学习。

FactorAnalysis

Factor Analysis (FA).

FastICA

FastICA:独立分量分析的快速算法。

IncrementalPCA

增量主成分分析(IPCA)。

KernelPCA

核心主成分分析(KPCA)。

LatentDirichletAllocation

采用在线变分Bayes算法的潜在Dirichlet分配。

MiniBatchDictionaryLearning

小批量词典学习。

MiniBatchNMF

小批量非负矩阵分解(NMF)。

MiniBatchSparsePCA

小批量稀疏主成分分析。

NMF

非负矩阵分解(NMF)。

PCA

主成分分析(PCA)。

SparseCoder

稀疏编码。

SparsePCA

稀疏主成分分析(SparsePCA)。

TruncatedSVD

使用截断的SVD(又名LSA)进行简化。

dict_learning

解决字典学习矩阵分解问题。

dict_learning_online

在线解决字典学习矩阵分解问题。

fastica

快速独立成分分析

non_negative_factorization

计算非负矩阵分解(NMF)。

sparse_encode

稀疏编码。

LinearDiscriminantAnalysis

线性辨别分析。

QuadraticDiscriminantAnalysis

二次鉴别分析。

DummyClassifier

DummyClassifier做出忽略输入特征的预测。

DummyRegressor

使用简单规则进行预测的回归器。

AdaBoostClassifier

AdaBoost分类器。

AdaBoostRegressor

AdaBoost回归器。

BaggingClassifier

袋装分类器。

BaggingRegressor

巴格回归者。

ExtraTreesClassifier

一个额外的树分类器。

ExtraTreesRegressor

额外的树回归因子。

GradientBoostingClassifier

用于分类的梯度增强。

GradientBoostingRegressor

梯度提升回归。

HistGradientBoostingClassifier

基于柱状图的梯度增强分类树。

HistGradientBoostingRegressor

基于柱状图的梯度增强回归树。

IsolationForest

隔离森林算法。

RandomForestClassifier

随机森林分类器。

RandomForestRegressor

随机森林回归量。

RandomTreesEmbedding

完全随机的树的集合。

StackingClassifier

具有最终分类器的估计器堆栈。

StackingRegressor

具有最终回归量的估计量堆栈。

VotingClassifier

不适合估计量的软投票/多数规则分类器。

VotingRegressor

非拟合估计量的预测投票回归量。

ConvergenceWarning

捕获收敛问题的自定义警告

DataConversionWarning

用于通知代码中发生的隐式数据转换的警告。

DataDimensionalityWarning

自定义警告,以通知数据维度的潜在问题。

EfficiencyWarning

用于通知用户计算效率低下的警告。

FitFailedWarning

如果在拟合估计量时出现错误,则使用警告类。

InconsistentVersionWarning

当估计器用不一致的版本进行解picking时,会出现警告。

NotFittedError

如果在匹配之前使用估计量,则引发异常类。

UndefinedMetricWarning

当指标无效时使用警告

EstimatorCheckFailedWarning

当常见测试的估计器检查失败时,会发出警告。

enable_halving_search_cv

启用连续减半搜索估计器

enable_iterative_imputer

启用迭代输入机

DictVectorizer

Transforms lists of feature-value mappings to vectors.

FeatureHasher

实现具有哈希功能,又名哈希技巧。

PatchExtractor

从图像集合中提取补丁。

extract_patches_2d

将2D图像重塑为补丁集合。

grid_to_graph

像素到像素连接的图表。

img_to_graph

像素到像素梯度连接的图形。

reconstruct_from_patches_2d

Reconstruct the image from all of its patches.

CountVectorizer

将文本文档集合转换为令牌计数矩阵。

HashingVectorizer

将文本文档集合转换为标记出现的矩阵。

TfidfTransformer

将计数矩阵转换为规格化tf或tf-idf表示。

TfidfVectorizer

将原始文档集合转换为TF-IDF功能矩阵。

GenericUnivariateSelect

具有可配置策略的单变量特征选择器。

RFE

特征排名,具有循环特征消除。

RFECV

通过交叉验证来选择特征的渐进特征消除。

SelectFdr

筛选器:选择估计错误发现率的p值。

SelectFpr

过滤器:根据FPR测试选择低于Alpha的p值。

SelectFromModel

元转换器,用于根据重要性权重选择特征。

SelectFwe

过滤器:选择与系列错误率对应的p值。

SelectKBest

根据k个最高分数选择特征。

SelectPercentile

根据最高分数的百分位数选择功能。

SelectorMixin

Transformer mixin,在给定支持屏蔽的情况下执行功能选择

SequentialFeatureSelector

执行顺序特征选择的Transformer。

VarianceThreshold

删除所有低方差特征的特征选择器。

chi2

计算每个非负特征和类别之间的卡方统计数据。

f_classif

计算所提供样本的方差分析F值。

f_regression

单变量线性回归测试返回F统计量和p值。

mutual_info_classif

估计离散目标变量的互信息。

mutual_info_regression

估计连续目标变量的互信息。

r_regression

计算每个特征和目标的Pearson r。

FrozenEstimator

包裹已匹配的估计器以防止重新匹配的估计器。

GaussianProcessClassifier

基于拉普拉斯近似的高斯过程分类。

GaussianProcessRegressor

高斯过程回归(GPT)。

CompoundKernel

由一组其他内核组成的内核。

ConstantKernel

DotProduct

ExpSineSquared

Exp-Sine-Squared内核(又名周期内核)。

Exponentiation

Exponentiation内核接受一个基本内核和一个纯量参数

Hyperparameter

以命名字节形式的内核超参数规范。

Kernel

所有内核的Base Class。

Matern

PairwiseKernel

sklearn.metrics.pairwise中的内核包装。

Product

Product 内核需要两个内核 \(k_1\)\(k_2\)

RBF

Radial basis function kernel (aka squared-exponential kernel).

RationalQuadratic

Sum

Sum 内核需要两个内核 \(k_1\)\(k_2\)

WhiteKernel

IterativeImputer

多元估算器,从所有其他特征中估计每个特征。

KNNImputer

使用k-最近邻居填补缺失值的插补。

MissingIndicator

缺失值的二进制指标。

SimpleImputer

Univariate imputer for completing missing values with simple strategies.

partial_dependence

部分依赖 features .

permutation_importance

用于特征评估的排列重要性 [Rd9e56ef97513-BRE].

DecisionBoundaryDisplay

决策边界可视化。

PartialDependenceDisplay

部分依赖图(PDP)。

IsotonicRegression

等张回归模型。

check_increasing

确定y是否与x单调相关。

isotonic_regression

求解等张回归模型。

AdditiveChi2Sampler

添加剂chi 2内核的大致特征图。

Nystroem

使用训练数据的子集来逼近内核地图。

PolynomialCountSketch

多项式核近似通过张量草图。

RBFSampler

Approximate a RBF kernel feature map using random Fourier features.

SkewedChi2Sampler

“斜卡方”核的大致特征地图。

KernelRidge

核岭回归。

LogisticRegression

逻辑回归(又名logit、MaxEnt)分类器。

LogisticRegressionCV

逻辑回归CV(又名logit,MaxEnt)分类器。

PassiveAggressiveClassifier

被动攻击性分类器。

Perceptron

Linear perceptron classifier.

RidgeClassifier

使用岭回归的分类器。

RidgeClassifierCV

具有内置交叉验证的岭分类器。

SGDClassifier

线性分类器(支持者、逻辑回归等)接受新加坡元培训。

SGDOneClassSVM

使用随机梯度下降来求解线性一类支持者。

LinearRegression

普通最小平方线性回归。

Ridge

Linear least squares with l2 regularization.

RidgeCV

具有内置交叉验证的岭回归。

SGDRegressor

线性模型通过最小化与新元的正规化经验损失来进行。

ElasticNet

以L1和L2先验组合作为正规化器的线性回归。

ElasticNetCV

弹性网络模型,沿着规则化路径迭代匹配。

Lars

最小角度回归模型,又名拉尔。

LarsCV

交叉验证的最小角回归模型。

Lasso

线性模型之前使用L1作为正规化器(又名Lasso)进行训练。

LassoCV

Lasso线性模型,沿着规则化路径迭代匹配。

LassoLars

Lasso模型与最小角度回归(又名最小角度回归)进行匹配拉斯。

LassoLarsCV

使用LARS算法交叉验证Lasso。

LassoLarsIC

Lasso模型与Lars匹配,使用BIC或AIC进行模型选择。

OrthogonalMatchingPursuit

垂直匹配追求模型(OMP)。

OrthogonalMatchingPursuitCV

交叉验证的垂直匹配追求模型(OMP)。

ARDRegression

Bayesian ARD回归。

BayesianRidge

贝氏岭回归。

MultiTaskElasticNet

多任务ElasticNet模型使用L1/L2混合规范作为正规化器进行训练。

MultiTaskElasticNetCV

多任务L1/L2 ElasticNet,内置交叉验证。

MultiTaskLasso

多任务Lasso模型使用L1/L2混合规范作为正规化器进行训练。

MultiTaskLassoCV

多任务Lasso模型使用L1/L2混合规范作为正规化器进行训练。

HuberRegressor

对异常值具有鲁棒性的L2正规化线性回归模型。

QuantileRegressor

预测条件分位数的线性回归模型。

RANSACRegressor

RANSAC (RANdom SAmple Consensus) algorithm.

TheilSenRegressor

Theil-Sen Estimate:稳健的多元回归模型。

GammaRegressor

具有伽玛分布的广义线性模型。

PoissonRegressor

具有Poisson分布的广义线性模型。

TweedieRegressor

具有Tweedie分布的广义线性模型。

PassiveAggressiveRegressor

被动侵略回归者。

enet_path

通过坐标下降计算弹性净路径。

lars_path

使用LARS算法计算最小角度回归或Lasso路径。

lars_path_gram

充足统计数据模式下的lars_track。

lasso_path

使用坐标下降计算Lasso路径。

orthogonal_mp

垂直匹配追求(OMP)。

orthogonal_mp_gram

革兰氏正匹配追求(OMP)。

ridge_regression

用法向方程的方法求解山脊方程。

Isomap

Isomap嵌入。

LocallyLinearEmbedding

局部线性嵌入。

MDS

多维缩放。

SpectralEmbedding

Spectral embedding for non-linear dimensionality reduction.

TSNE

T分布随机邻居嵌入。

locally_linear_embedding

对数据执行局部线性嵌入分析。

smacof

使用SMACOF算法计算多维缩放。

spectral_embedding

将样本投影到拉普拉斯图的第一个特征向。

trustworthiness

指定本地结构在多大程度上被保留。

check_scoring

根据用户选项确定评分者。

get_scorer

从字符串中获取得分手。

get_scorer_names

获取所有可用得分者的姓名。

make_scorer

根据性能指标或损失函数制作评分器。

accuracy_score

准确性分类评分。

auc

使用梯形规则计算曲线下面积(UC)。

average_precision_score

根据预测分数计算平均精度(AP)。

balanced_accuracy_score

计算平衡准确度。

brier_score_loss

计算Brier得分损失。

class_likelihood_ratios

计算二元分类正可能比和负可能比。

classification_report

构建显示主要分类指标的文本报告。

cohen_kappa_score

计算Cohen的kappa:衡量注释者之间一致性的统计数据。

confusion_matrix

计算混淆矩阵以评估分类的准确性。

d2_log_loss_score

\(D^2\) 评分函数,对数损失的分数解释。

dcg_score

计算贴现累积收益。

det_curve

计算不同概率阈值的错误率。

f1_score

计算F1评分,也称为平衡F评分或F测量。

fbeta_score

计算F-beta评分。

hamming_loss

计算平均海明损失。

hinge_loss

平均铰链损失(非正规化)。

jaccard_score

贾卡德相似性系数得分。

log_loss

日志损失,又名物流损失或交叉熵损失。

matthews_corrcoef

计算马修斯相关系数(MCC)。

multilabel_confusion_matrix

为每个类别或样本计算混淆矩阵。

ndcg_score

计算归一化贴现累积增益。

precision_recall_curve

Compute precision-recall pairs for different probability thresholds.

precision_recall_fscore_support

计算每个类的精确度、召回率、F-测度和支持度。

precision_score

计算精度。

recall_score

计算召回。

roc_auc_score

计算受试者工作特征曲线下面积(ROC AUC) 来自预测分数。

roc_curve

计算受试者工作特征(ROC)。

top_k_accuracy_score

Top-k准确性分类得分。

zero_one_loss

零级损失。

d2_absolute_error_score

\(D^2\) 回归评分函数,绝对误差分数解释。

d2_pinball_score

\(D^2\) 回归评分函数,弹球损失的比例解释。

d2_tweedie_score

\(D^2\) 回归评分函数,解释了Tweedie偏差的分数。

explained_variance_score

解释了方差回归得分函数。

max_error

max_oss指标计算最大残余误差。

mean_absolute_error

平均绝对误差回归损失。

mean_absolute_percentage_error

平均绝对百分比误差(MAPE)回归损失。

mean_gamma_deviance

平均伽玛偏差回归损失。

mean_pinball_loss

分位数回归的弹球损失。

mean_poisson_deviance

平均Poisson偏差回归损失。

mean_squared_error

均方误差回归损失。

mean_squared_log_error

均方对数误差回归损失。

mean_tweedie_deviance

平均Tweedie偏差回归损失。

median_absolute_error

中位数绝对误差回归损失。

r2_score

\(R^2\) (决定系数)回归评分函数。

root_mean_squared_error

均方误差回归损失。

root_mean_squared_log_error

平方根对数误差回归损失。

coverage_error

覆盖误差测量。

label_ranking_average_precision_score

计算基于排名的平均精度。

label_ranking_loss

计算排名损失测量。

adjusted_mutual_info_score

调整后的两个集群之间的互信息。

adjusted_rand_score

兰德指数根据机会进行调整。

calinski_harabasz_score

Compute the Calinski and Harabasz score.

contingency_matrix

构建描述标签之间关系的权宜矩阵。

pair_confusion_matrix

由两个集群产生的配对混淆矩阵。

completeness_score

在给定基本事实的情况下计算集群标签的完整性度量。

davies_bouldin_score

计算Davies-Bouldin分数。

fowlkes_mallows_score

测量一组点的两个集群的相似性。

homogeneity_completeness_v_measure

立即计算均匀性、完整性以及V测量分数。

homogeneity_score

给定基本事实的集群标签的均匀性度量。

mutual_info_score

两个集群之间的互信息。

normalized_mutual_info_score

两个集群之间的标准化互信息。

rand_score

兰德指数。

silhouette_samples

Compute the Silhouette Coefficient for each sample.

silhouette_score

计算所有样本的平均轮廓系数。

v_measure_score

给定基本事实的V测量集群标记。

consensus_score

两组双集群的相似性。

DistanceMetric

快速距离度量功能的统一接口。

additive_chi2_kernel

计算X和Y中观察值之间的加性卡方核。

chi2_kernel

Compute the exponential chi-squared kernel between X and Y.

cosine_distances

计算X和Y中样本之间的cos距离。

cosine_similarity

计算X和Y中样本之间的cos相似度。

distance_metrics

pairwise_distinctions的有效指标。

euclidean_distances

根据一个矩阵X和Y计算每对之间的距离矩阵。

haversine_distances

计算X和Y中样本之间的半轴距离。

kernel_metrics

pairwise_kernels的有效指标。

laplacian_kernel

计算X和Y之间的拉普拉斯核。

linear_kernel

计算X和Y之间的线性核。

manhattan_distances

计算X和Y中的载体之间的L1距离。

nan_euclidean_distances

在存在缺失值的情况下计算欧几里得距离。

paired_cosine_distances

计算X和Y之间的成对cos距离。

paired_distances

计算X和Y之间的成对距离。

paired_euclidean_distances

计算X和Y之间的成对欧几里得距离。

paired_manhattan_distances

计算X和Y之间的成对L1距离。

pairwise_kernels

计算数组X和可选数组Y之间的内核。

polynomial_kernel

Compute the polynomial kernel between X and Y.

rbf_kernel

计算X和Y之间的rBF(高斯)核。

sigmoid_kernel

计算X和Y之间的Sigmoid核。

pairwise_distances

根据一个矩阵X和可选的Y计算距离矩阵。

pairwise_distances_argmin

计算一个点和一组点之间的最小距离。

pairwise_distances_argmin_min

计算一个点和一组点之间的最小距离。

pairwise_distances_chunked

逐块生成距离矩阵,并可选择简化。

ConfusionMatrixDisplay

混乱矩阵可视化。

DetCurveDisplay

DET曲线可视化。

PrecisionRecallDisplay

精确召回可视化。

PredictionErrorDisplay

回归模型预测误差的可视化。

RocCurveDisplay

ROC曲线可视化。

BayesianGaussianMixture

高斯混合物的变分Bayesian估计。

GaussianMixture

高斯混合。

GroupKFold

具有非重叠组的K折叠迭代器变体。

GroupShuffleSplit

Shuffle-Group(s)-Out交叉验证迭代器。

KFold

K-Fold交叉验证器。

LeaveOneGroupOut

Leave One Group Out cross-validator.

LeaveOneOut

留一出交叉验证器。

LeavePGroupsOut

将P Group排除在外交叉验证器。

LeavePOut

Leave-P-Out交叉验证器。

PredefinedSplit

预定义的分割交叉验证程序。

RepeatedKFold

重复K折交叉验证器。

RepeatedStratifiedKFold

重复分层K折叠交叉验证器。

ShuffleSplit

随机排列交叉验证器。

StratifiedGroupKFold

分层K-Fold迭代器变体,具有非重叠组。

StratifiedKFold

分层K-Fold交叉验证器。

StratifiedShuffleSplit

分层ShuffleSplit交叉验证器。

TimeSeriesSplit

时间序列交叉验证器。

check_cv

用于构建交叉验证器的输入检查器实用程序。

train_test_split

将数组或矩阵拆分为随机训练和测试子集。

GridSearchCV

对估计器的指定参数值进行详尽搜索。

HalvingGridSearchCV

通过连续减半搜索指定的参数值。

HalvingRandomSearchCV

随机搜索超参数。

ParameterGrid

参数网格,每个参数都有离散数量的值。

ParameterSampler

从给定分布中采样的参数生成器。

RandomizedSearchCV

随机搜索超参数。

FixedThresholdClassifier

手动设置决策阈值的二元分类器。

TunedThresholdClassifierCV

使用交叉验证对决策阈值进行后调整的分类器。

cross_val_predict

Generate cross-validated estimates for each input data point.

cross_val_score

通过交叉验证评估分数。

cross_validate

通过交叉验证评估指标,并记录适合/评分时间。

learning_curve

学习曲线。

permutation_test_score

评估交叉验证评分与排列的显著性。

validation_curve

验证曲线。

LearningCurveDisplay

学习曲线可视化。

ValidationCurveDisplay

验证曲线可视化。

OneVsOneClassifier

一对一的多类策略。

OneVsRestClassifier

一对其余(OvR)多类策略。

OutputCodeClassifier

(错误更正)输出代码多类策略。

ClassifierChain

一个多标签模型,将二进制分类器排列成一个链。

MultiOutputClassifier

多目标分类。

MultiOutputRegressor

多目标回归。

RegressorChain

将回归安排到链中的多标签模型。

BernoulliNB

多元伯努里模型的朴素Bayes分类器。

CategoricalNB

类别特征的朴素Bayes分类器。

ComplementNB

Rennie等人(2003)中描述的互补朴素贝叶斯分类器。

GaussianNB

高斯朴素的Bayes(GaussianNB)。

MultinomialNB

用于多项模型的朴素Bayes分类器。

BallTree

快速广义N点问题的BallTree算法

KDTree

快速广义N点问题的KDTree

KNeighborsClassifier

实现k近邻投票的分类器。

KNeighborsRegressor

基于k近邻的回归。

KNeighborsTransformer

将X转换为k个最近邻居的(加权)图。

KernelDensity

核密度估计。

LocalOutlierFactor

使用本地异常值因子(LOF)进行无监督异常值检测。

NearestCentroid

最近的重心分类器。

NearestNeighbors

用于实施邻居搜索的无监督学习器。

NeighborhoodComponentsAnalysis

邻里要素分析。

RadiusNeighborsClassifier

在给定半径内的邻居之间实现投票的分类器。

RadiusNeighborsRegressor

基于固定半径内邻居的回归。

RadiusNeighborsTransformer

将X转换为比半径更近的邻居的(加权)图。

kneighbors_graph

计算X中点的k-邻居的(加权)图。

radius_neighbors_graph

计算X中点的邻居的(加权)图。

sort_graph_by_row_values

对稀疏图进行排序,以使每一行的值都增加。

BernoulliRBM

Bernoulli Restricted Boltzmann Machine (RBM).

MLPClassifier

多层感知器分类器。

MLPRegressor

多层感知器回归器。

FeatureUnion

级联多个Transformer对象的结果。

Pipeline

具有可选最终预测器的数据转换器序列。

make_pipeline

构建 Pipeline 来自给定的估计者。

make_union

构建 FeatureUnion 来自给定的变压器。

Binarizer

根据阈值对数据进行二值化(将特征值设置为0或1)。

FunctionTransformer

从任意可调用对象构造Transformer。

KBinsDiscretizer

将连续数据放入时间间隔中。

KernelCenterer

将任意核矩阵置于中心 \(K\) .

LabelBinarizer

以one-vs-all的方式二进制化标签。

LabelEncoder

使用0和n_classes-1之间的值对目标标签进行编码。

MaxAbsScaler

按每个要素的最大绝对值缩放。

MinMaxScaler

通过将每个特征缩放到给定范围来变换特征。

MultiLabelBinarizer

在可迭代项和多标签格式之间转换。

Normalizer

将样本单独标准化至单位规范。

OneHotEncoder

将类别功能编码为一热数字数组。

OrdinalEncoder

将类别特征编码为一个整元数组。

PolynomialFeatures

生成多项和交互功能。

PowerTransformer

按特征应用幂变换以使数据更像高斯。

QuantileTransformer

使用分位数信息变换要素。

RobustScaler

使用对离群值具有鲁棒性的统计数据来缩放特征。

SplineTransformer

为特征生成一元B样条基。

StandardScaler

通过删除均值并缩放到单位方差来标准化特征。

TargetEncoder

用于回归和分类目标的目标编码器。

add_dummy_feature

使用额外的虚拟功能来增强数据集。

binarize

类数组或scipy.稀疏矩阵的布尔阈值化。

label_binarize

以one-vs-all的方式二进制化标签。

maxabs_scale

将每个功能扩展到 [-1, 1] 范围而不破坏稀疏性。

minmax_scale

通过将每个特征缩放到给定范围来变换特征。

normalize

Scale input vectors individually to unit norm (vector length).

power_transform

参数单调变换使数据更加类似高斯。

quantile_transform

使用分位数信息变换要素。

robust_scale

标准化沿着任何轴的数据集。

scale

标准化沿着任何轴的数据集。

GaussianRandomProjection

通过高斯随机投影降低维度。

SparseRandomProjection

通过稀疏随机投影降低维度。

johnson_lindenstrauss_min_dim

找到“安全”数量的组件来随机投影。

LabelPropagation

标签传播分类器。

LabelSpreading

用于半监督学习的LabelSpreading模型。

SelfTrainingClassifier

自训练分类器。

LinearSVC

线性支持向量分类。

LinearSVR

线性支持向量回归机

NuSVC

NU-支持向量分类。

NuSVR

Nu支持载体回归。

OneClassSVM

无监督离群点检测。

SVC

C-支持载体分类。

SVR

Epsilon-支持向量回归。

l1_min_c

返回C的下限。

DecisionTreeClassifier

决策树分类器。

DecisionTreeRegressor

决策树回归器。

ExtraTreeClassifier

一个极其随机的树分类器。

ExtraTreeRegressor

一个极其随机的树回归器。

export_graphviz

以DOT格式输出决策树。

export_text

构建显示决策树规则的文本报告。

plot_tree

绘制决策树。

Bunch

容器对象将关键字公开为属性。

_safe_indexing

使用索引返回X的行、项或列。

as_float_array

Convert an array-like to an array of floats.

assert_all_finite

如果X包含NaN或无穷大,则抛出ValueHelp。

deprecated

将函数或类标记为已弃用的装饰器。

estimator_html_repr

构建估计器的HTML表示。

gen_batches

生成器创建包含的切片 batch_size 从0到 n .

gen_even_slices

Generator to create n_packs evenly spaced slices going up to n.

indexable

使数组可索引以进行交叉验证。

murmurhash3_32

计算种子处密钥的32位murmurhash 3。

resample

以一致的方式重新采样数组或稀疏矩阵。

safe_mask

退回X上可以安全使用的口罩。

safe_sqr

类数组和稀疏矩阵的逐元素平方。

shuffle

以一致的方式洗牌数组或稀疏矩阵。

Tags

估算者的标签。

InputTags

输入数据的标签。

TargetTags

目标数据的标签。

ClassifierTags

分类器的标签。

RegressorTags

Tags for the regressor.

TransformerTags

Transformer的标签。

get_tags

获取估计器标签。

check_X_y

标准估计量的输入验证。

check_array

数组、列表、稀疏矩阵或类似矩阵上的输入验证。

check_consistent_length

检查所有阵列是否具有一致的第一维度。

check_random_state

将种子转换为NP.random.RandomState实例。

check_scalar

指定纯量参数类型和值。

check_is_fitted

执行估计量的拟合验证。

check_memory

检查 memory 是滑稽的。记忆般的。

check_symmetric

确保阵列是2D、方形且对称的。

column_or_1d

Ravel列或1d numpy数组,否则会引发错误。

has_fit_parameter

检查估计器的匹配方法是否支持给定参数。

validate_data

卸载输入数据并设置或检查输入的要素名称和计数。

available_if

仅在check返回真值时才可用的属性。

compute_class_weight

估计不平衡数据集的类权重。

compute_sample_weight

按类别估计不平衡数据集的样本权重。

is_multilabel

检查是否 y 是多标签格式。

type_of_target

确定目标指示的数据类型。

unique_labels

提取唯一标签的有序数组。

density

计算稀疏向量的密度。

fast_logdet

计算方形矩阵的分母的对数。

randomized_range_finder

计算一个范围接近A范围的标准正交矩阵。

randomized_svd

计算截短的随机MVD。

safe_sparse_dot

正确处理稀疏矩阵情况的点积。

weighted_mode

返回传递的数组中的加权模态(最常见)值的数组。

incr_mean_variance_axis

计算CSR或CSC矩阵上沿轴的增量平均值和方差。

inplace_column_scale

CSC/CSR矩阵的就地列缩放。

inplace_csr_column_scale

CSR矩阵的就地列缩放。

inplace_row_scale

CSR或CSC矩阵的就地行扩展。

inplace_swap_column

就地交换CSC/CSR矩阵的两列。

inplace_swap_row

就地交换CSC/CSR矩阵的两行。

mean_variance_axis

计算CSR或CSC矩阵上轴的均值和方差。

inplace_csr_row_normalize_l1

Normalize inplace the rows of a CSR matrix or array by their L1 norm.

inplace_csr_row_normalize_l2

通过L2规范对CSR矩阵或数组的行进行规范化。

single_source_shortest_path_length

返回从源到所有可达节点的最短路径长度。

sample_without_replacement

不带替换的示例整数。

min_pos

找到数组的最小值超过正值。

MetadataRequest

包含消费者的元数据请求信息。

MetadataRouter

存储和处理路由器对象的元数据路由。

MethodMapping

存储路由器的调用方和被调用方方法之间的映射。

get_routing_for_object

得到一个 Metadata{Router, Request} 来自给定对象的实例。

process_routing

收件箱和路线输入参数。

all_displays

从获取所有显示器的列表 sklearn .

all_estimators

从以下获取所有估计器的列表 sklearn .

all_functions

获取所有函数的列表, sklearn .

check_estimator

检查估计器是否遵守scikit-learn惯例。

parametrize_with_checks

用于参数化估计器检查的Pytest特定装饰器。

estimator_checks_generator

迭代生成估计器的所有可调用检查。

Parallel

削弱的 joblib.Parallel 传播scikit-learn配置。

delayed

装饰器用于捕获函数的参数。