使用主成分分析消除冗余数据

Principal Component Analysis Eigenvalue

主成分分析特征值

什么是GIS中的主成分分析?

主成分分析。你可能以前见过这个缩写词。PCA代表“**主成分分析**“。

但它是什么?它是如何在GIS和遥感中使用的?

有时,变量之间高度相关,使得它是在另一个变量中发现的重复信息。主成分分析**识别多个数据集上的重复数据**。仅将基本信息汇总到称为“主要组件 ”的组中。

PCA的功能是创建一个只包含基本信息的新数据集。

最重要的是,在使用PCA时减少了冗余。

ArcGIS中的主成分分析示例

海拔、坡度和山阴数据如何?

这三个数据集有冗余吗?

以下是如何在ArcGIS中对海拔、山阴和坡带进行PCA分析:

Principal Component Analysis: Elevaton, Hillshade, Slope

1运行“复合波段”工具

“复合波段”工具将高程、阴影和坡度栅格组合为一个3带栅格。使用以下栅格作为输入:

  • 波段1: 高程

  • 波段2: 山体阴影

  • 波段3: 斜率

将新栅格输出为 合成

2执行“主要组件”工具

使用空间分析扩展,使用以下标准执行“主要组件”工具:

  • 将新栅格输出为: 合成

  • 输出栅格: PCA

  • 主要成分数量: 3

  • **输出数据文件:**主要组件.txt

结果将是一个3通道PCA组合和一个显示冗余量的数据文件。

3分析主要成分表

“特征值百分比”显示每个主成分占多少。

PC层

EigenValue

特征值百分比

特征值累计

1

699.9

67.1

67.1

2

323.6

31

98.1

3

19.5

1.9

100

该表显示**第一部分占协方差的67.1%**

当您添加第二个通道时,它**占协方差的98.1%。**第三部分没有提供太多额外的信息(1.9%),与主要部分1和2略有多余。

如何在遥感中使用PCA?

对三个波段进行主成分分析是有用的——我们发现第三个波段没有添加太多信息。

10波段(多光谱)栅格**呢?甚至是**100或200波段(高光谱)

这就是PCA真正有用的地方- multispectral and hyperspectral analysis

例如,如果大部分方差(特征值)是在主成分1、2和3中找到的,那么只需要使用这三个主成分。对于陆地覆盖物分类,与所有10个波段相比,使用三个波段要容易得多。

总之,PCA识别多个通道上的重复数据,减少冗余,加快处理时间。这是**主成分分析图像处理**。

接下来是什么?

在处理高度相关的变量时,可以运行 主成分分析 看看是哪一个。

如果你测试过这个 主成分分析指南 ,尝试掌握这些其他空间统计指南: