sklearn.utils#

各种公用事业机构来帮助开发。

Developer guide. 看到 开发人员的实用程序 部分了解更多详细信息。

Bunch

容器对象将关键字公开为属性。

_safe_indexing

使用索引返回X的行、项或列。

as_float_array

Convert an array-like to an array of floats.

assert_all_finite

如果X包含NaN或无穷大,则抛出ValueHelp。

deprecated

将函数或类标记为已弃用的装饰器。

estimator_html_repr

构建估计器的HTML表示。

gen_batches

生成器创建包含的切片 batch_size 从0到 n .

gen_even_slices

Generator to create n_packs evenly spaced slices going up to n.

indexable

使数组可索引以进行交叉验证。

murmurhash3_32

计算种子处密钥的32位murmurhash 3。

resample

以一致的方式重新采样数组或稀疏矩阵。

safe_mask

退回X上可以安全使用的口罩。

safe_sqr

类数组和稀疏矩阵的逐元素平方。

shuffle

以一致的方式洗牌数组或稀疏矩阵。

Tags

估算者的标签。

InputTags

输入数据的标签。

TargetTags

目标数据的标签。

ClassifierTags

分类器的标签。

RegressorTags

Tags for the regressor.

TransformerTags

Transformer的标签。

get_tags

获取估计器标签。

输入和参数验证#

用于验证scikit-learn估计器中的输入和参数的函数。

check_X_y

标准估计量的输入验证。

check_array

数组、列表、稀疏矩阵或类似矩阵上的输入验证。

check_consistent_length

检查所有阵列是否具有一致的第一维度。

check_random_state

将种子转换为NP.random.RandomState实例。

check_scalar

指定纯量参数类型和值。

validation.check_is_fitted

执行估计量的拟合验证。

validation.check_memory

检查 memory 是滑稽的。记忆般的。

validation.check_symmetric

确保阵列是2D、方形且对称的。

validation.column_or_1d

Ravel列或1d numpy数组,否则会引发错误。

validation.has_fit_parameter

检查估计器的匹配方法是否支持给定参数。

validation.validate_data

卸载输入数据并设置或检查输入的要素名称和计数。

元估计量#

元估计器的实用程序。

metaestimators.available_if

仅在check返回真值时才可用的属性。

基于类别标签的重量处理#

用于根据类别标签处理权重的实用程序。

class_weight.compute_class_weight

估计不平衡数据集的类权重。

class_weight.compute_sample_weight

按类别估计不平衡数据集的样本权重。

在分类器中处理多类目标#

用于处理分类器中多类/多输出目标的实用程序。

multiclass.is_multilabel

检查是否 y 是多标签格式。

multiclass.type_of_target

确定目标指示的数据类型。

multiclass.unique_labels

提取唯一标签的有序数组。

最佳数学运算#

用于在scikit-learn中执行最佳数学运算的实用程序。

extmath.density

计算稀疏向量的密度。

extmath.fast_logdet

计算方形矩阵的分母的对数。

extmath.randomized_range_finder

计算一个范围接近A范围的标准正交矩阵。

extmath.randomized_svd

计算截短的随机MVD。

extmath.safe_sparse_dot

正确处理稀疏矩阵情况的点积。

extmath.weighted_mode

返回传递的数组中的加权模态(最常见)值的数组。

使用稀疏矩阵和数组#

用于处理稀疏矩阵和数组的实用程序的集合。

sparsefuncs.incr_mean_variance_axis

计算CSR或CSC矩阵上沿轴的增量平均值和方差。

sparsefuncs.inplace_column_scale

CSC/CSR矩阵的就地列缩放。

sparsefuncs.inplace_csr_column_scale

CSR矩阵的就地列缩放。

sparsefuncs.inplace_row_scale

CSR或CSC矩阵的就地行扩展。

sparsefuncs.inplace_swap_column

就地交换CSC/CSR矩阵的两列。

sparsefuncs.inplace_swap_row

就地交换CSC/CSR矩阵的两行。

sparsefuncs.mean_variance_axis

计算CSR或CSC矩阵上轴的均值和方差。

使用Cython编写的稀疏矩阵和数组的实用程序。

sparsefuncs_fast.inplace_csr_row_normalize_l1

Normalize inplace the rows of a CSR matrix or array by their L1 norm.

sparsefuncs_fast.inplace_csr_row_normalize_l2

通过L2规范对CSR矩阵或数组的行进行规范化。

使用图形#

图形实用程序和算法。

graph.single_source_shortest_path_length

返回从源到所有可达节点的最短路径长度。

随机抽样#

随机抽样的实用程序。

random.sample_without_replacement

不带替换的示例整数。

在阵列上操作的辅助功能#

对阵列操作的一小部分辅助函数。

arrayfuncs.min_pos

找到数组的最小值超过正值。

元数据路由#

在scikit-learn估计器中路由元数据的实用程序。

User guide. 看到 元数据路由 部分了解更多详细信息。

metadata_routing.MetadataRequest

包含消费者的元数据请求信息。

metadata_routing.MetadataRouter

存储和处理路由器对象的元数据路由。

metadata_routing.MethodMapping

存储路由器的调用方和被调用方方法之间的映射。

metadata_routing.get_routing_for_object

得到一个 Metadata{Router, Request} 来自给定对象的实例。

metadata_routing.process_routing

收件箱和路线输入参数。

发现scikit-learning对象#

发现scikit-learn对象的实用程序。

discovery.all_displays

从获取所有显示器的列表 sklearn .

discovery.all_estimators

从以下获取所有估计器的列表 sklearn .

discovery.all_functions

获取所有函数的列表, sklearn .

API兼容性检查器#

各种实用程序用于检查估计器与scikit-learn API的兼容性。

estimator_checks.check_estimator

检查估计器是否遵守scikit-learn惯例。

estimator_checks.parametrize_with_checks

用于参数化估计器检查的Pytest特定装饰器。

estimator_checks.estimator_checks_generator

迭代生成估计器的所有可调用检查。

并行计算#

的定制 joblibthreadpoolctl 用于scikit-learn使用的工具。

parallel.Parallel

削弱的 joblib.Parallel 传播scikit-learn配置。

parallel.delayed

装饰器用于捕获函数的参数。