validate_data#

sklearn.utils.validation.validate_data(_estimator, /, X='no_validation', y='no_validation', reset=True, validate_separately=False, skip_check_array=False, **check_params)[源代码]#

卸载输入数据并设置或检查输入的要素名称和计数。

此助手函数应用于需要输入验证的估计器中。这会变异估计器并设置 n_features_in_feature_names_in_ 属性如果 reset=True .

Added in version 1.6.

参数:
_estimator估计器实例

验证输入的估计器。

X{类数组,稀疏矩阵,矩阵}的形状 (n_samples,n_features),默认=“无验证”

输入样本。如果 'no_validation' ,不执行验证 X .这对于可以将输入验证委托给其基础估计器的元估计器很有用。在这种情况下 y 必须通过且唯一接受的 check_paramsmulti_outputy_numeric .

y形状类似数组(n_samples,),默认=' no_validation '

目标。

  • 如果 None , check_array 人们呼吁 X .如果估算者的 requires_y 标签为True,则会引发错误。

  • 如果 'no_validation' , check_array 人们呼吁 X 和估计者的 requires_y 标签被忽略。这是默认占位符,永远不会显式设置。在这种情况下 X 必须通过。

  • 否则只 y with _ check_y '或两者  `Xy 与之一进行检查 check_arraycheck_X_y 取决于 validate_separately .

reset布尔,默认=True

Whether to reset the n_features_in_ attribute. If False, the input will be checked for consistency with data provided when reset was last True.

备注

建议拨打 reset=Truefit 在第一次致电中 partial_fit .所有其他验证方法 X 应该设置 reset=False .

validate_separatelyFalse或字典元组,默认值=False

仅在以下情况下使用 yNone .如果 False ,打电话 check_X_y .否则,它必须是khargs的一个数组才能用于调用 check_arrayXy 分别

estimator=self 会自动添加到这些指令中,以便在输入数据无效的情况下生成信息更多的错误消息。

skip_check_array布尔,默认=假

如果 True , Xy 不变,只是 feature_names_in_n_features_in_ 已检查。否则, check_array 人们呼吁 Xy .

**check_paramskwargs

参数传递给 check_arraycheck_X_y .如果validate_separate不为False,则忽略。

estimator=self 自动添加到这些参数中,以便在输入数据无效时生成更多信息的错误消息。

返回:
out{ndray,sparse matrix}或这些的数组

经过验证的输入。如果两者都是,则返回二元组 Xy 得到验证。