LocallyLinearEmbedding#

class sklearn.manifold.LocallyLinearEmbedding(*, n_neighbors=5, n_components=2, reg=0.001, eigen_solver='auto', tol=1e-06, max_iter=100, method='standard', hessian_tol=0.0001, modified_tol=1e-12, neighbors_algorithm='auto', random_state=None, n_jobs=None)[源代码]#

局部线性嵌入。

阅读更多的 User Guide .

参数:
n_neighborsint,默认=5

每个点要考虑的邻居数量。

n_componentsint,默认=2

Number of coordinates for the manifold.

reg浮点数,默认值= 1 e-3

正规化常数乘以距离的局部协方差矩阵的轨迹。

eigen_solver' Auto ',' arpack ',默认='

用于计算特征量的求解器。可用的选项包括:

  • 'auto' :算法将尝试选择输入数据的最佳方法。

  • 'arpack' :在移位-反转模式中使用Arnoldi迭代。对于这种方法,M可以是稠密矩阵、稀疏矩阵或一般线性算子。

  • 'dense' 使用标准稠密矩阵运算进行特征值分解。对于此方法,M必须是数组或矩阵类型。对于大问题应避免使用此方法。

警告

ARPACK对于某些问题可能不稳定。 最好尝试几个随机种子以检查结果。

tolfloat,默认= 1 e-6

如果eigen_solver==' dense ',则不使用“arpack”方法的公差。

max_iterint,默认=100

arpack求解器的最大迭代次数。如果eigen_solver==' dense ',则不使用。

method'标准',' hessian ','修改',&
  • standard :使用标准的局部线性嵌入算法。见参考 [1]

  • hessian :使用黑森特征图方法。这种方法需要 n_neighbors > n_components * (1 + (n_components + 1) / 2 .见参考 [2]

  • modified :使用修改后的局部线性嵌入算法。见参考 [3]

  • ltsa :使用局部切空间对齐算法。见参考 [4]

hessian_tolfloat,默认= 1 e-4

Hessian特征映射方法的容忍度。仅在以下情况下使用 method == 'hessian' .

modified_tol浮点数,默认值= 1 e-12

修改后的LLE方法的公差。仅在以下情况下使用 method == 'modified' .

neighbors_algorithm' Auto ',' brute ',', 默认='自动'

用于最近邻搜索的算法,传递给 NearestNeighbors instance.

random_stateint,RandomState实例,默认=无

确定随机数生成器 eigen_solver ==' arpack '。传递int以获得跨多个函数调用的可重复结果。看到 Glossary .

n_jobsint或无,默认=无

要运行的并行作业数。 None 意思是1,除非在a中 joblib.parallel_backend 上下文 -1 意味着使用所有处理器。看到 Glossary 了解更多详细信息。

属性:
embedding_阵列状,形状 [n_samples, n_components]

存储嵌入载体

reconstruction_error_浮子

与相关的重建错误 embedding_

n_features_in_int

期间看到的功能数量 fit .

Added in version 0.24.

feature_names_in_ :nd形状数组 (n_features_in_ ,)nd数组形状(

Names of features seen during fit. Defined only when X has feature names that are all strings.

Added in version 1.0.

nbrs_NearestNeighbors对象

存储最近的邻居实例,包括BallTree或KDtree(如果适用)。

参见

SpectralEmbedding

Spectral embedding for non-linear dimensionality reduction.

TSNE

分布式随机邻居嵌入。

引用

[1]

Roweis,S. & Saul,L.通过局部线性嵌入进行非线性降维。 科学290:2323(2000)。

[2]

Donoho, D. & Grimes, C. Hessian eigenmaps: Locally linear embedding techniques for high-dimensional data. Proc Natl Acad Sci U S A. 100:5591 (2003).

[3]

Zhang, Z. & Wang, J. MLLE: Modified Locally Linear Embedding Using Multiple Weights. <https://citeseerx.ist.psu.edu/doc_view/pid/0b060fdbd92cbcc66b383bcaa9ba5e5e624d7ee3> _

[4]

张,Z。&查,H.通过切空间对齐的主管和非线性降维。上海大学学刊8:406(2004)

示例

>>> from sklearn.datasets import load_digits
>>> from sklearn.manifold import LocallyLinearEmbedding
>>> X, _ = load_digits(return_X_y=True)
>>> X.shape
(1797, 64)
>>> embedding = LocallyLinearEmbedding(n_components=2)
>>> X_transformed = embedding.fit_transform(X[:100])
>>> X_transformed.shape
(100, 2)
fit(X, y=None)[源代码]#

计算数据X的嵌入载体。

参数:
X形状类似阵列(n_samples,n_features)

训练装备。

y忽视

未使用,此处列出是为了按照惯例实现API一致性。

返回:
self对象

装配 LocallyLinearEmbedding 类实例。

fit_transform(X, y=None)[源代码]#

计算数据X的嵌入载体并变换X。

参数:
X形状类似阵列(n_samples,n_features)

训练装备。

y忽视

未使用,此处列出是为了按照惯例实现API一致性。

返回:
X_new类似阵列,形状(n_samples,n_components)

返回实例本身。

get_feature_names_out(input_features=None)[源代码]#

获取用于转换的输出要素名称。

输出的功能名称将以大写的类别名称为开头。例如,如果Transformer输出3个特征,则输出的特征名称为: ["class_name0", "class_name1", "class_name2"] .

参数:
input_features字符串或无的类数组,默认=无

仅用于通过中看到的名称验证要素名称 fit .

返回:
feature_names_out字符串对象的nd数组

转换的功能名称。

get_metadata_routing()[源代码]#

获取此对象的元数据路由。

请检查 User Guide 关于路由机制如何工作。

返回:
routingMetadataRequest

A MetadataRequest 封装路由信息。

get_params(deep=True)[源代码]#

获取此估计器的参数。

参数:
deep布尔,默认=True

如果为True,将返回此估计量和包含的作为估计量的子对象的参数。

返回:
paramsdict

参数名称映射到其值。

set_output(*, transform=None)[源代码]#

设置输出容器。

看到 介绍 set_output API 了解如何使用API的示例。

参数:
transform{“默认”,“pandas”,“polars”},默认=无

配置输出 transformfit_transform .

  • "default" :Transformer的默认输出格式

  • "pandas" :DataFrame输出

  • "polars" :两极输出

  • None :转换配置不变

Added in version 1.4: "polars" 添加了选项。

返回:
self估计器实例

估计实例。

set_params(**params)[源代码]#

设置此估计器的参数。

该方法适用于简单估计器以及嵌套对象(例如 Pipeline ).后者具有以下形式的参数 <component>__<parameter> 以便可以更新嵌套对象的每个组件。

参数:
**paramsdict

估计参数。

返回:
self估计器实例

估计实例。

transform(X)[源代码]#

将新点转换为嵌入空间。

参数:
X形状类似阵列(n_samples,n_features)

训练装备。

返回:
X_new形状的nd数组(n_samples,n_components)

返回实例本身。

注意到

由于这种方法执行缩放,因此不鼓励将其与非缩放不变的方法(例如支持者服务器)一起使用。