Isomap#
- class sklearn.manifold.Isomap(*, n_neighbors=5, radius=None, n_components=2, eigen_solver='auto', tol=0, max_iter=None, path_method='auto', neighbors_algorithm='auto', n_jobs=None, metric='minkowski', p=2, metric_params=None)[源代码]#
Isomap嵌入。
通过等距映射实现非线性降维
阅读更多的 User Guide .
- 参数:
- n_neighborsint或无,默认=5
每个点要考虑的邻居数量。如果
n_neighbors
是int,那么radius
必须None
.- radius浮动或无,默认=无
限制邻居返回的距离。如果
radius
是一个浮动,那么n_neighbors
必须设置为None
.Added in version 1.1.
- n_componentsint,默认=2
Number of coordinates for the manifold.
- eigen_solver' Auto ',' arpack ',默认='
'auto':尝试为给定问题选择最有效的求解器。
“arpack”:使用Arnoldi分解来查找特征值和特征载体。
“密集”:使用直接求解器(即LAPACK)进行特征值分解。
- tolfloat,默认=0
收敛容差传递给arpack或lobpcg。如果eigen_solver ==' dense ',则不使用。
- max_iterint,默认=无
arpack求解器的最大迭代次数。如果eigen_solver ==' dense ',则不使用。
- path_method'自动',',',默认='自动'
查找最短路径时使用的方法。
“Auto”:尝试自动选择最佳算法。
“FW”:Flocke-Warshall算法。
“D”:Dijkstra的算法。
- neighbors_algorithm' Auto ',' brute ',', 默认='自动'
用于最近邻居搜索的算法,传递给邻居。NearestNeighbors实例。
- n_jobsint或无,默认=无
要运行的并行作业数。
None
意思是1,除非在a中joblib.parallel_backend
上下文-1
意味着使用所有处理器。看到 Glossary 了解更多详细信息。- metric字符串,或可调用,默认=“minkowski”
计算要素数组中实例之间的距离时使用的指标。如果指标是字符串或可调用,则它必须是允许的选项之一
sklearn.metrics.pairwise_distances
其指标参数。如果度量是“预先计算的”,则假设X是距离矩阵并且必须是平方。X可以是 Glossary .Added in version 0.22.
- pfloat,默认=2
Minkowski指标的参数来自sklearn.metrics.pairwise.pairwise_diversions。当p = 1时,这相当于对于p = 2使用manhattan_Distance(l1)和euclidean_Distance(l2)。对于任意p,使用minkowski_Distance(l_p)。
Added in version 0.22.
- metric_paramsdict,默认=无
指标函数的附加关键字参数。
Added in version 0.22.
- 属性:
- embedding_类似阵列,形状(n_samples,n_components)
存储嵌入载体。
- kernel_pca_对象
KernelPCA
用于实现嵌入的对象。- nbrs_sklearn.neighbors.NearestNeighbors实例
存储最近的邻居实例,包括BallTree或KDtree(如果适用)。
- dist_matrix_类似阵列,形状(n_samples,n_samples)
存储训练数据的测地距离矩阵。
- n_features_in_int
期间看到的功能数量 fit .
Added in version 0.24.
- feature_names_in_ :nd形状数组 (
n_features_in_
,)nd数组形状( Names of features seen during fit. Defined only when
X
has feature names that are all strings.Added in version 1.0.
参见
sklearn.decomposition.PCA
主成分分析是一种线性降维方法。
sklearn.decomposition.KernelPCA
使用核和PCA进行非线性降维。
MDS
使用多维缩放进行多元化学习。
TSNE
T分布随机邻居嵌入。
LocallyLinearEmbedding
使用局部线性嵌入进行总管学习。
SpectralEmbedding
非线性维度的谱嵌入。
引用
[1]Tenenbaum,JB;德席尔瓦,V.; &兰福德,JC非线性降维的全球几何框架。科学290(5500)
示例
>>> from sklearn.datasets import load_digits >>> from sklearn.manifold import Isomap >>> X, _ = load_digits(return_X_y=True) >>> X.shape (1797, 64) >>> embedding = Isomap(n_components=2) >>> X_transformed = embedding.fit_transform(X[:100]) >>> X_transformed.shape (100, 2)
- fit(X, y=None)[源代码]#
计算数据X的嵌入载体。
- 参数:
- X{类数组、稀疏矩阵、BallTree、KDTree、NearestNeighbors}
样本数据,形状=(n_samples,n_features),形式为numpy数组、稀疏矩阵、预计算树或NearestNeighbors对象。
- y忽视
未使用,按照惯例,为了API一致性而存在。
- 返回:
- self对象
返回适合的自我实例。
- fit_transform(X, y=None)[源代码]#
根据X中的数据匹配模型并转换X。
- 参数:
- X{array-like,sparse matrix,BallTree,KDTree}
训练载体,在哪里
n_samples
是样本数量和n_features
是功能的数量。- y忽视
未使用,按照惯例,为了API一致性而存在。
- 返回:
- X_new类似阵列,形状(n_samples,n_components)
X在新的空间中变形。
- get_feature_names_out(input_features=None)[源代码]#
获取用于转换的输出要素名称。
输出的功能名称将以大写的类别名称为开头。例如,如果Transformer输出3个特征,则输出的特征名称为:
["class_name0", "class_name1", "class_name2"]
.- 参数:
- input_features字符串或无的类数组,默认=无
仅用于通过中看到的名称验证要素名称
fit
.
- 返回:
- feature_names_out字符串对象的nd数组
转换的功能名称。
- get_metadata_routing()[源代码]#
获取此对象的元数据路由。
请检查 User Guide 关于路由机制如何工作。
- 返回:
- routingMetadataRequest
A
MetadataRequest
封装路由信息。
- get_params(deep=True)[源代码]#
获取此估计器的参数。
- 参数:
- deep布尔,默认=True
如果为True,将返回此估计量和包含的作为估计量的子对象的参数。
- 返回:
- paramsdict
参数名称映射到其值。
- reconstruction_error()[源代码]#
计算嵌入的重建误差。
- 返回:
- reconstruction_error浮子
重建错误。
注意到
Isomap嵌入的成本函数为
E = frobenius_norm[K(D) - K(D_fit)] / n_samples
其中D是输入数据X的距离矩阵,D_fit是输出嵌入X_fit的距离矩阵,K是isomap内核:
K(D) = -0.5 * (I - 1/n_samples) * D^2 * (I - 1/n_samples)
- set_output(*, transform=None)[源代码]#
设置输出容器。
看到 介绍 set_output API 了解如何使用API的示例。
- 参数:
- transform{“默认”,“pandas”,“polars”},默认=无
配置输出
transform
和fit_transform
."default"
:Transformer的默认输出格式"pandas"
:DataFrame输出"polars"
:两极输出None
:转换配置不变
Added in version 1.4:
"polars"
添加了选项。
- 返回:
- self估计器实例
估计实例。
- set_params(**params)[源代码]#
设置此估计器的参数。
该方法适用于简单估计器以及嵌套对象(例如
Pipeline
).后者具有以下形式的参数<component>__<parameter>
以便可以更新嵌套对象的每个组件。- 参数:
- **paramsdict
估计参数。
- 返回:
- self估计器实例
估计实例。
- transform(X)[源代码]#
变形X。
这是通过将点X链接到训练数据的测地距离图中来实现的。首先
n_neighbors
在训练数据中找到X的最近邻居,并从中计算从X中的每个点到训练数据中的每个点的最短测地距离,以构建核。X的嵌入是该核到训练集的嵌入载体上的投影。- 参数:
- X{类数组,稀疏矩阵},形状(n_questions,n_features)
如果neighborhors_algorithm =' precalled ',则假设X是距离矩阵或形状的稀疏图(n_queries,n_samples_fit)。
- 返回:
- X_new类数组,形状(n_questions,n_components)
X在新的空间中变形。