validate_data#
- sklearn.utils.validation.validate_data(_estimator, /, X='no_validation', y='no_validation', reset=True, validate_separately=False, skip_check_array=False, **check_params)[源代码]#
卸载输入数据并设置或检查输入的要素名称和计数。
此助手函数应用于需要输入验证的估计器中。这会变异估计器并设置
n_features_in_
和feature_names_in_
属性如果reset=True
.Added in version 1.6.
- 参数:
- _estimator估计器实例
验证输入的估计器。
- X{类数组,稀疏矩阵,矩阵}的形状 (n_samples,n_features),默认=“无验证”
输入样本。如果
'no_validation'
,不执行验证X
.这对于可以将输入验证委托给其基础估计器的元估计器很有用。在这种情况下y
必须通过且唯一接受的check_params
是multi_output
和y_numeric
.- y形状类似数组(n_samples,),默认=' no_validation '
目标。
如果
None
,check_array
人们呼吁X
.如果估算者的requires_y
标签为True,则会引发错误。如果
'no_validation'
,check_array
人们呼吁X
和估计者的requires_y
标签被忽略。这是默认占位符,永远不会显式设置。在这种情况下X
必须通过。否则只
y
with_ check_y '或两者 `X
和y
与之一进行检查check_array
或check_X_y
取决于validate_separately
.
- reset布尔,默认=True
Whether to reset the
n_features_in_
attribute. If False, the input will be checked for consistency with data provided when reset was last True.备注
建议拨打
reset=True
在fit
在第一次致电中partial_fit
.所有其他验证方法X
应该设置reset=False
.- validate_separatelyFalse或字典元组,默认值=False
仅在以下情况下使用
y
不None
.如果False
,打电话check_X_y
.否则,它必须是khargs的一个数组才能用于调用check_array
对X
和y
分别estimator=self
会自动添加到这些指令中,以便在输入数据无效的情况下生成信息更多的错误消息。- skip_check_array布尔,默认=假
如果
True
,X
和y
不变,只是feature_names_in_
和n_features_in_
已检查。否则,check_array
人们呼吁X
和y
.- **check_paramskwargs
参数传递给
check_array
或check_X_y
.如果validate_separate不为False,则忽略。estimator=self
自动添加到这些参数中,以便在输入数据无效时生成更多信息的错误消息。
- 返回:
- out{ndray,sparse matrix}或这些的数组
经过验证的输入。如果两者都是,则返回二元组
X
和y
得到验证。