validate_data#

sklearn.utils.validation.validate_data(_estimator, /, X='no_validation', y='no_validation', reset=True, validate_separately=False, skip_check_array=False, **check_params)[源代码]#

卸载输入数据并设置或检查输入的要素名称和计数。

此助手函数应用于需要输入验证的估计器中。这会变异估计器并设置 n_features_in_ 和 feature_names_in_ 属性如果 reset=True .

Added in version 1.6.

参数:

_estimator估计器实例

验证输入的估计器。

X{类数组，稀疏矩阵，矩阵}的形状（n_samples，n_features），默认=“无验证”

输入样本。如果 'no_validation' ，不执行验证 X .这对于可以将输入验证委托给其基础估计器的元估计器很有用。在这种情况下 y 必须通过且唯一接受的 check_params 是 multi_output 和 y_numeric .

y形状类似数组（n_samples，），默认=' no_validation '

目标。

如果 None , check_array 人们呼吁 X .如果估算者的 requires_y 标签为True，则会引发错误。
如果 'no_validation' , check_array 人们呼吁 X 和估计者的 requires_y 标签被忽略。这是默认占位符，永远不会显式设置。在这种情况下 X 必须通过。
否则只 y with _ check_y '或两者 `X 和 y 与之一进行检查 check_array 或 check_X_y 取决于 validate_separately .

reset布尔，默认=True

Whether to reset the n_features_in_ attribute. If False, the input will be checked for consistency with data provided when reset was last True.

备注

建议拨打 reset=True 在 fit 在第一次致电中 partial_fit .所有其他验证方法 X 应该设置 reset=False .

validate_separatelyFalse或字典元组，默认值=False

仅在以下情况下使用 y 不 None .如果 False ，打电话 check_X_y .否则，它必须是khargs的一个数组才能用于调用 check_array 对 X 和 y 分别

estimator=self 会自动添加到这些指令中，以便在输入数据无效的情况下生成信息更多的错误消息。

skip_check_array布尔，默认=假

如果 True , X 和 y 不变，只是 feature_names_in_ 和 n_features_in_ 已检查。否则， check_array 人们呼吁 X 和 y .

**check_paramskwargs

参数传递给 check_array 或 check_X_y .如果validate_separate不为False，则忽略。

estimator=self 自动添加到这些参数中，以便在输入数据无效时生成更多信息的错误消息。

返回:

out{ndray，sparse matrix}或这些的数组: 经过验证的输入。如果两者都是，则返回二元组 X 和 y 得到验证。