主成分分析您可能以前见过这个首字母缩略词。 PCA 代表“主成分分析”。
但它是什么?我们如何在 GIS 和遥感中使用它?
有时,变量高度相关,以至于在另一个变量中找到重复信息。主成分分析识别多个数据集中的重复数据。然后,PCA 仅将基本信息聚合到称为“主成分”的组中。
PCA 的强大之处在于它创建了一个仅包含基本信息的新数据集。底线是您在使用 PCA 时减少了冗余。
GIS 中的主成分分析是什么?
因此,主成分分析捕获了数据集之间的冗余。
但是海拔、坡度和山体阴影数据呢?这三个数据集是否存在冗余?如果是这样,多少钱?
今天,让我们探讨如何使用 ArcGIS Desktop 运行包含高程、山体阴影和坡度带的 PCA 分析。
步骤 1. 运行“复合波段”工具
复合波段工具将高程、山体阴影和坡度栅格组合成一个 3 波段栅格。使用以下栅格作为输入:
- 海拔:波段 1
- 山体阴影::带 2
- 斜率: 3 级
将新栅格输出为Composite
Step 2. 执行“Principal Components”工具
使用 ArcGIS 中的空间分析扩展模块,使用以下条件执行“主成分”工具:
- 输入栅格:复合
- 输出栅格: PCA
- 主要部件数量: 3
- 输出数据文件: PrincipalComponents.txt
结果将是一个 3 通道 PCA 合成和一个显示冗余量的数据文件。
步骤 3. 分析主成分表
“特征值百分比”显示每个主成分所占的比例。
此表显示第一个分量占协方差的 67.1% 。
当您添加第二个通道时,它占协方差的 98.1% 。第三个组件没有提供太多额外信息 (1.9%) ,并且与主要组件 1 和 2 略有冗余。
如何在遥感中使用PCA?
对三个波段进行主成分分析很有用,因为我们发现第三个成分并没有增加太多信息。
10 波段多光谱图像怎么样?甚至100 或 200 个波段(高光谱图像) ?
这就是 PCA 真正有用的地方—— 多光谱和高光谱分析。
例如,如果在主成分一、二和三中找到大部分方差(特征值),则只需要使用这三个主成分。对于土地覆盖分类,与全部 10 个波段相比,使用三个波段要容易得多。
总之,PCA 识别多个通道上的重复数据,减少冗余,并加快处理时间。这是主成分分析图像处理的关键。
下一步是什么?
在处理高度相关变量的地方,您可以运行主成分分析来查看哪些变量是多余的。
如果您测试过此主成分分析指南,请尝试掌握这些其他空间统计指南: