Isomap#

class sklearn.manifold.Isomap(*, n_neighbors=5, radius=None, n_components=2, eigen_solver='auto', tol=0, max_iter=None, path_method='auto', neighbors_algorithm='auto', n_jobs=None, metric='minkowski', p=2, metric_params=None)[源代码]#

Isomap嵌入。

通过等距映射实现非线性降维

阅读更多的 User Guide .

参数:
n_neighborsint或无,默认=5

每个点要考虑的邻居数量。如果 n_neighbors 是int,那么 radius 必须 None .

radius浮动或无,默认=无

限制邻居返回的距离。如果 radius 是一个浮动,那么 n_neighbors 必须设置为 None .

Added in version 1.1.

n_componentsint,默认=2

Number of coordinates for the manifold.

eigen_solver' Auto ',' arpack ',默认='

'auto':尝试为给定问题选择最有效的求解器。

“arpack”:使用Arnoldi分解来查找特征值和特征载体。

“密集”:使用直接求解器(即LAPACK)进行特征值分解。

tolfloat,默认=0

收敛容差传递给arpack或lobpcg。如果eigen_solver ==' dense ',则不使用。

max_iterint,默认=无

arpack求解器的最大迭代次数。如果eigen_solver ==' dense ',则不使用。

path_method'自动',',',默认='自动'

查找最短路径时使用的方法。

“Auto”:尝试自动选择最佳算法。

“FW”:Flocke-Warshall算法。

“D”:Dijkstra的算法。

neighbors_algorithm' Auto ',' brute ',', 默认='自动'

用于最近邻居搜索的算法,传递给邻居。NearestNeighbors实例。

n_jobsint或无,默认=无

要运行的并行作业数。 None 意思是1,除非在a中 joblib.parallel_backend 上下文 -1 意味着使用所有处理器。看到 Glossary 了解更多详细信息。

metric字符串,或可调用,默认=“minkowski”

计算要素数组中实例之间的距离时使用的指标。如果指标是字符串或可调用,则它必须是允许的选项之一 sklearn.metrics.pairwise_distances 其指标参数。如果度量是“预先计算的”,则假设X是距离矩阵并且必须是平方。X可以是 Glossary .

Added in version 0.22.

pfloat,默认=2

Minkowski指标的参数来自sklearn.metrics.pairwise.pairwise_diversions。当p = 1时,这相当于对于p = 2使用manhattan_Distance(l1)和euclidean_Distance(l2)。对于任意p,使用minkowski_Distance(l_p)。

Added in version 0.22.

metric_paramsdict,默认=无

指标函数的附加关键字参数。

Added in version 0.22.

属性:
embedding_类似阵列,形状(n_samples,n_components)

存储嵌入载体。

kernel_pca_对象

KernelPCA 用于实现嵌入的对象。

nbrs_sklearn.neighbors.NearestNeighbors实例

存储最近的邻居实例,包括BallTree或KDtree(如果适用)。

dist_matrix_类似阵列,形状(n_samples,n_samples)

存储训练数据的测地距离矩阵。

n_features_in_int

期间看到的功能数量 fit .

Added in version 0.24.

feature_names_in_ :nd形状数组 (n_features_in_ ,)nd数组形状(

Names of features seen during fit. Defined only when X has feature names that are all strings.

Added in version 1.0.

参见

sklearn.decomposition.PCA

主成分分析是一种线性降维方法。

sklearn.decomposition.KernelPCA

使用核和PCA进行非线性降维。

MDS

使用多维缩放进行多元化学习。

TSNE

T分布随机邻居嵌入。

LocallyLinearEmbedding

使用局部线性嵌入进行总管学习。

SpectralEmbedding

非线性维度的谱嵌入。

引用

[1]

Tenenbaum,JB;德席尔瓦,V.; &兰福德,JC非线性降维的全球几何框架。科学290(5500)

示例

>>> from sklearn.datasets import load_digits
>>> from sklearn.manifold import Isomap
>>> X, _ = load_digits(return_X_y=True)
>>> X.shape
(1797, 64)
>>> embedding = Isomap(n_components=2)
>>> X_transformed = embedding.fit_transform(X[:100])
>>> X_transformed.shape
(100, 2)
fit(X, y=None)[源代码]#

计算数据X的嵌入载体。

参数:
X{类数组、稀疏矩阵、BallTree、KDTree、NearestNeighbors}

样本数据,形状=(n_samples,n_features),形式为numpy数组、稀疏矩阵、预计算树或NearestNeighbors对象。

y忽视

未使用,按照惯例,为了API一致性而存在。

返回:
self对象

返回适合的自我实例。

fit_transform(X, y=None)[源代码]#

根据X中的数据匹配模型并转换X。

参数:
X{array-like,sparse matrix,BallTree,KDTree}

训练载体,在哪里 n_samples 是样本数量和 n_features 是功能的数量。

y忽视

未使用,按照惯例,为了API一致性而存在。

返回:
X_new类似阵列,形状(n_samples,n_components)

X在新的空间中变形。

get_feature_names_out(input_features=None)[源代码]#

获取用于转换的输出要素名称。

输出的功能名称将以大写的类别名称为开头。例如,如果Transformer输出3个特征,则输出的特征名称为: ["class_name0", "class_name1", "class_name2"] .

参数:
input_features字符串或无的类数组,默认=无

仅用于通过中看到的名称验证要素名称 fit .

返回:
feature_names_out字符串对象的nd数组

转换的功能名称。

get_metadata_routing()[源代码]#

获取此对象的元数据路由。

请检查 User Guide 关于路由机制如何工作。

返回:
routingMetadataRequest

A MetadataRequest 封装路由信息。

get_params(deep=True)[源代码]#

获取此估计器的参数。

参数:
deep布尔,默认=True

如果为True,将返回此估计量和包含的作为估计量的子对象的参数。

返回:
paramsdict

参数名称映射到其值。

reconstruction_error()[源代码]#

计算嵌入的重建误差。

返回:
reconstruction_error浮子

重建错误。

注意到

Isomap嵌入的成本函数为

E = frobenius_norm[K(D) - K(D_fit)] / n_samples

其中D是输入数据X的距离矩阵,D_fit是输出嵌入X_fit的距离矩阵,K是isomap内核:

K(D) = -0.5 * (I - 1/n_samples) * D^2 * (I - 1/n_samples)

set_output(*, transform=None)[源代码]#

设置输出容器。

看到 介绍 set_output API 了解如何使用API的示例。

参数:
transform{“默认”,“pandas”,“polars”},默认=无

配置输出 transformfit_transform .

  • "default" :Transformer的默认输出格式

  • "pandas" :DataFrame输出

  • "polars" :两极输出

  • None :转换配置不变

Added in version 1.4: "polars" 添加了选项。

返回:
self估计器实例

估计实例。

set_params(**params)[源代码]#

设置此估计器的参数。

该方法适用于简单估计器以及嵌套对象(例如 Pipeline ).后者具有以下形式的参数 <component>__<parameter> 以便可以更新嵌套对象的每个组件。

参数:
**paramsdict

估计参数。

返回:
self估计器实例

估计实例。

transform(X)[源代码]#

变形X。

这是通过将点X链接到训练数据的测地距离图中来实现的。首先 n_neighbors 在训练数据中找到X的最近邻居,并从中计算从X中的每个点到训练数据中的每个点的最短测地距离,以构建核。X的嵌入是该核到训练集的嵌入载体上的投影。

参数:
X{类数组,稀疏矩阵},形状(n_questions,n_features)

如果neighborhors_algorithm =' precalled ',则假设X是距离矩阵或形状的稀疏图(n_queries,n_samples_fit)。

返回:
X_new类数组,形状(n_questions,n_components)

X在新的空间中变形。