Isomap#

class sklearn.manifold.Isomap(*, n_neighbors=5, radius=None, n_components=2, eigen_solver='auto', tol=0, max_iter=None, path_method='auto', neighbors_algorithm='auto', n_jobs=None, metric='minkowski', p=2, metric_params=None)[源代码]#

Isomap嵌入。

通过等距映射实现非线性降维

阅读更多的 User Guide .

参数:

n_neighborsint或无，默认=5

每个点要考虑的邻居数量。如果 n_neighbors 是int，那么 radius 必须 None .

radius浮动或无，默认=无

限制邻居返回的距离。如果 radius 是一个浮动，那么 n_neighbors 必须设置为 None .

Added in version 1.1.

n_componentsint，默认=2

Number of coordinates for the manifold.

eigen_solver' Auto '，' arpack '，默认='

'auto'：尝试为给定问题选择最有效的求解器。

“arpack”：使用Arnoldi分解来查找特征值和特征载体。

“密集”：使用直接求解器（即LAPACK）进行特征值分解。

tolfloat，默认=0

收敛容差传递给arpack或lobpcg。如果eigen_solver ==' dense '，则不使用。

max_iterint，默认=无

arpack求解器的最大迭代次数。如果eigen_solver ==' dense '，则不使用。

path_method'自动'，'，'，默认='自动'

查找最短路径时使用的方法。

“Auto”：尝试自动选择最佳算法。

“FW”：Flocke-Warshall算法。

“D”：Dijkstra的算法。

neighbors_algorithm' Auto '，' brute '，'，默认='自动'

用于最近邻居搜索的算法，传递给邻居。NearestNeighbors实例。

n_jobsint或无，默认=无

要运行的并行作业数。 None 意思是1，除非在a中 joblib.parallel_backend 上下文 -1 意味着使用所有处理器。看到 Glossary 了解更多详细信息。

metric字符串，或可调用，默认=“minkowski”

计算要素数组中实例之间的距离时使用的指标。如果指标是字符串或可调用，则它必须是允许的选项之一 sklearn.metrics.pairwise_distances 其指标参数。如果度量是“预先计算的”，则假设X是距离矩阵并且必须是平方。X可以是 Glossary .

Added in version 0.22.

pfloat，默认=2

Minkowski指标的参数来自sklearn.metrics.pairwise.pairwise_diversions。当p = 1时，这相当于对于p = 2使用manhattan_Distance（l1）和euclidean_Distance（l2）。对于任意p，使用minkowski_Distance（l_p）。

Added in version 0.22.

metric_paramsdict，默认=无

指标函数的附加关键字参数。

Added in version 0.22.

属性:

embedding_类似阵列，形状（n_samples，n_components）: 存储嵌入载体。
kernel_pca_对象: KernelPCA 用于实现嵌入的对象。
nbrs_sklearn.neighbors.NearestNeighbors实例: 存储最近的邻居实例，包括BallTree或KDtree（如果适用）。
dist_matrix_类似阵列，形状（n_samples，n_samples）: 存储训练数据的测地距离矩阵。
n_features_in_int: 期间看到的功能数量 fit .

Added in version 0.24.
feature_names_in_ ：nd形状数组 (n_features_in_ ,)nd数组形状（: Names of features seen during fit. Defined only when X has feature names that are all strings.

Added in version 1.0.

参见

sklearn.decomposition.PCA: 主成分分析是一种线性降维方法。
sklearn.decomposition.KernelPCA: 使用核和PCA进行非线性降维。
MDS: 使用多维缩放进行多元化学习。
TSNE: T分布随机邻居嵌入。
LocallyLinearEmbedding: 使用局部线性嵌入进行总管学习。
SpectralEmbedding: 非线性维度的谱嵌入。

引用

[1]

Tenenbaum，JB;德席尔瓦，V.; &兰福德，JC非线性降维的全球几何框架。科学290（5500）

示例

>>> from sklearn.datasets import load_digits
>>> from sklearn.manifold import Isomap
>>> X, _ = load_digits(return_X_y=True)
>>> X.shape
(1797, 64)
>>> embedding = Isomap(n_components=2)
>>> X_transformed = embedding.fit_transform(X[:100])
>>> X_transformed.shape
(100, 2)

fit(X, y=None)[源代码]#

计算数据X的嵌入载体。

参数:

X{类数组、稀疏矩阵、BallTree、KDTree、NearestNeighbors}: 样本数据，形状=（n_samples，n_features），形式为numpy数组、稀疏矩阵、预计算树或NearestNeighbors对象。
y忽视: 未使用，按照惯例，为了API一致性而存在。

返回:

self对象: 返回适合的自我实例。

fit_transform(X, y=None)[源代码]#

根据X中的数据匹配模型并转换X。

参数:

X{array-like，sparse matrix，BallTree，KDTree}: 训练载体，在哪里 n_samples 是样本数量和 n_features 是功能的数量。
y忽视: 未使用，按照惯例，为了API一致性而存在。

返回:

X_new类似阵列，形状（n_samples，n_components）: X在新的空间中变形。

get_feature_names_out(input_features=None)[源代码]#

获取用于转换的输出要素名称。

输出的功能名称将以大写的类别名称为开头。例如，如果Transformer输出3个特征，则输出的特征名称为： ["class_name0", "class_name1", "class_name2"] .

参数:

input_features字符串或无的类数组，默认=无: 仅用于通过中看到的名称验证要素名称 fit .

返回:

feature_names_out字符串对象的nd数组: 转换的功能名称。

get_metadata_routing()[源代码]#

获取此对象的元数据路由。

请检查 User Guide 关于路由机制如何工作。

返回:

routingMetadataRequest: A MetadataRequest 封装路由信息。

get_params(deep=True)[源代码]#

获取此估计器的参数。

参数:

deep布尔，默认=True: 如果为True，将返回此估计量和包含的作为估计量的子对象的参数。

返回:

paramsdict: 参数名称映射到其值。

reconstruction_error()[源代码]#

计算嵌入的重建误差。

返回:

reconstruction_error浮子: 重建错误。

注意到

Isomap嵌入的成本函数为

E = frobenius_norm[K(D) - K(D_fit)] / n_samples

其中D是输入数据X的距离矩阵，D_fit是输出嵌入X_fit的距离矩阵，K是isomap内核：

K(D) = -0.5 * (I - 1/n_samples) * D^2 * (I - 1/n_samples)

set_output(*, transform=None)[源代码]#

设置输出容器。

看到介绍 set_output API 了解如何使用API的示例。

参数:

transform{“默认”，“pandas”，“polars”}，默认=无

配置输出 transform 和 fit_transform .

"default" ：Transformer的默认输出格式
"pandas" ：DataFrame输出
"polars" ：两极输出
None ：转换配置不变

Added in version 1.4: "polars" 添加了选项。

返回:

self估计器实例: 估计实例。

set_params(**params)[源代码]#

设置此估计器的参数。

该方法适用于简单估计器以及嵌套对象（例如 Pipeline ).后者具有以下形式的参数 <component>__<parameter> 以便可以更新嵌套对象的每个组件。

参数:

**paramsdict: 估计参数。

返回:

self估计器实例: 估计实例。

transform(X)[源代码]#

变形X。

这是通过将点X链接到训练数据的测地距离图中来实现的。首先 n_neighbors 在训练数据中找到X的最近邻居，并从中计算从X中的每个点到训练数据中的每个点的最短测地距离，以构建核。X的嵌入是该核到训练集的嵌入载体上的投影。

参数:

X{类数组，稀疏矩阵}，形状（n_questions，n_features）: 如果neighborhors_algorithm =' precalled '，则假设X是距离矩阵或形状的稀疏图（n_queries，n_samples_fit）。

返回:

X_new类数组，形状（n_questions，n_components）: X在新的空间中变形。