14.3. 准确度评估¶
准确度评估
当然,在现实世界中,许多种类或特征是不同质的,它们是由一种材料制成,并形成一种确定的形状。考虑类“field”。在生长季节,田地由土壤、作物和一定程度的水分(短暂的)混合而成。土壤有多种类型,颜色、成分和质地各不相同,作物的种类和密度也各不相同(缺席=休耕地)。另一类是“城市”,它可以包括由不同材料制成的各种各样的建筑,大小和形状各异;由混凝土或沥青构成的道路;树木和草地,以及其他变量。我们通常可以将类进一步细分为更具体的类别,例如“饱和玉米田”或“购物中心”,前提是它们与在建立原型培训站点时确定的独特或独特的光谱特征密切对应。一个类别固有的几种物质或特征的内部混合,其含义与上述几个类别的分辨率相关跨接混合不同。
13-7: Consider this class: "factory complex". In this case, it occupies a non-residential part of suburbia. Break it down into the likely components (internal mix) that are present, even though it is implied by its name to be a single unit. `ANSWER <answers.html#13-7>`__
作者在1974年夏末的第一次经历中就清楚了上述观点中的一些要素,当时他正在实地考察由拉里斯(普渡大学)处理系统进行的无监督分类,并为随后的监督分类指定新的培训地点。位于怀俄明州中西部风河山脉西南侧的冰河柳湖为中心的分类区域。在到达现场之前,我们准备了一系列计算机生成的打印件(很久以来就放错地方了),其中字母数字符号代表每个光谱类别(统计上可分离但未识别)。相同符号的不同集群表明存在离散的土地利用/覆盖类别。在处理过程中,我们允许类的总数发生变化。有7到10个此类类的打印输出看起来最现实。但是没有 先验的 决定哪一个最准确。在游览这个地区时,我们不得不修改或修改我们对课程的预想。我们没有考虑到草和山艾树的重要性,也没有预料到陆地卫星多光谱扫描仪分辨率低于79米(259英尺)的树木丛。经过实地考察,作者从坡顶俯视现场,试图将不同地图上的图案与地面特征的分布相匹配。结果令人信服:八级地图略优于其他地图。如果没有这一点基本事实,我们就不会有信心解释地图,并得出其准确性的任何衡量标准。相反,所发生的是通过实地检查该区域的一小部分,对超过25平方公里(约10平方英里)的地图区域的可靠性进行“验证”。
我们可以 定义 准确度,在工作意义上,如 观察与现实的对应程度(通常为百分比) . 我们通常根据现有地图、大型航空照片或实地检查来判断准确性。我们可以提出两个关于准确性的基本问题:分类中的每一个类别是否真的存在于地图上指定的点上?分隔类别的边界是否与所处位置一样有效?各种类型的误差会降低特征识别和类别分布的准确性。无论是在测量还是在采样中,我们都会产生大部分误差。主要有三种错误类型:
数据采集错误:包括传感器性能、平台稳定性和观察条件。我们可以通过系统校正(例如,通过使用产生已知辐射的车载光源校准探测器响应)来减少或补偿它们。在原始数据的初始处理过程中,我们可以进行修正,通常由辅助数据(如已知的大气条件)进行修改。
数据处理错误:一个例子是陆地卫星专题制图器不同波段中等效像素的错误配准。几何校正的目标是将不匹配保持在不超过一个像素的位移上。在理想条件下,在一个场景中分布多达25个地面控制点(GCP),我们就可以实现这一目标。几个像素的错误注册显著降低了精度。
与场景相关的错误:如前一页所述,其中一个错误与我们如何定义和建立类有关,而类又对观测系统的分辨率和参考地图或照片敏感。这些误差的三个例子来自一个常见的地质情况(在第2节中也作了一定程度的处理),在这种情况下,我们主要处理传感器数据,以识别地表的岩石类型。在这个过程中有一些陷阱。首先,地质学家在野外绘制基岩图,但在地表的大部分地区,土壤和植被覆盖或掩盖了许多地方的基岩。地质学家在野外对最可能埋藏在地表之下的岩石类型进行了逻辑推断,并在地图上显示了这一点,在地图上,他们将这些掩蔽材料视为不可见(忽略)。不幸的是,这种处理与传感器所看到的不一致。第二,大多数地质图是地层图而不是岩性图,也就是说,它们由按年龄而不是岩石类型确定的单位组成。因此,地图通过不同的符号或颜色显示相同或相似的岩石类型,因此检查地面真实性需要转换为岩性(通常很难,因为单位在岩性上可能不同,但为某些其他均匀模式而选择)。第三,我们可能需要考虑与周围环境相关的岩石类型,以便正确命名。例如,花岗岩和一种叫做长石砂岩的沉积岩具有相似的光谱特性。然而,后者通常出现在地层中,因为它是一个沉积地层,其空间模式(尤其是当暴露为褶皱或倾斜层时)通常与大块花岗岩的空间模式非常不同,并且通常通过地形表达来揭示。
以上几点提出了一个问题:关于什么的准确性?我们用作标准的地图主要是外推,或者更准确地说是抽象的。它们通常是主题,记录一个或多个表面类型或主题的信号-但忽略其他-噪音。但是,无论传感器能否解决这些问题,它都能看到一切。在量化准确性时,如果可能的话,我们必须对缺乏等效性和整体性进行调整。另一个经常被忽视的关于地图作为参考标准的观点,涉及到地图的内在或绝对准确性。地图需要一个独立的参照系来确定其有效性。几个世纪以来,大多数地图的绘制都没有考虑到对其固有准确性的评估。最近几年,一些地图附带了一个信心水平声明。根据航空照片,美国地质调查局报告了一级分类1:250000和1:1000000土地利用图(见第4节)的精度评估结果,该结果符合95%置信水平下85%的精度标准。
一般来说,遥感分类的准确度水平取决于不同的因素,如训练地点的适宜性、分配给每个班的个别区域的大小、形状、分布和出现频率、传感器性能和分辨率以及分类所涉及的方法(视觉PHotoInterpreting与计算机辅助统计分类)等。图中显示了改进空间分辨率和目标尺寸对减小误差的相互作用的定量测量:
|显示改进的空间分辨率和目标大小如何减少分类操作中出错的可能性的图表。|
在减少30米(98英尺)误差方面的显著改进部分与目标等级的性质有关。粗分辨率在区分作物类型方面是无效的,但是高分辨率(<20米)除了可能识别物种外,在识别这些类型方面几乎没有什么作用。随着作物面积的增大,误差进一步减小。森林的反常趋势(高分辨率时的最大误差)可能是“看不见森林中的树木”这句话的结果——在这里,这句话意味着高分辨率开始显示单个物种,并在树冠上出现会混淆“森林”类完整性的断裂。两个相反的趋势影响这些误差曲线的行为:1)光谱响应值的统计方差减小,而2)混合像素的比例随着分辨率的降低而增加。
对分类精度与谱带数量的函数关系的研究显示了以下趋势:
从一个波段增加到两个波段可以最大限度地提高精度。大约四个波段后,精度增加会变平或增长非常缓慢。因此,额外的波段可能是多余的,因为波段间的相互关系会发生变化(这种相互关系可能被最小化,甚至通过主成分分析发挥优势)。然而,额外的波段,如TM波段5和7,可以有助于识别岩石类型(地质学),因为不同的岩石类型吸收某些波长,这有助于在这些光谱间隔中识别它们。请注意,最高的精度与作物类型有关,因为在土壤背景下,由规则的植物空间行组成的田地往往更加均匀。
在实践中,我们可以用四种方法来测试分类的准确性:1)在选定的点(通常是非严格的和主观的)进行现场检查,随机或沿网格选择;2)估计(非严格的)类图和参考图之间主题或类群同一性的一致性,通常通过将一个映射到另一个(s)来确定;3)ST对抽样、测量和处理数据中开发的数值数据进行统计分析(严格),使用试验,如均方根、标准误差、方差分析、相关系数、线性或多元回归分析和卡方试验(有关这些试验的解释,请参阅统计的任何标准文本);和4混淆矩阵计算(严格)。我们利用作者于1977年7月对包括马里兰埃尔克顿(顶部中心)在内的陆地卫星图像的次新世的研究来解释最后一种方法。
我们从环境保护局获得了一张1:24000的航空照片,这张照片属于这个次新世。从1977年8月的实地考察开始,在与7月飞越相同的生长季节,我们确定了照片中许多农场的作物,其中我们选择了大约12个作为培训地点。大部分是玉米或大豆,另一些主要是大麦和小麦。然后我们进行了最大似然监督分类,如下所示,
|最大似然监督分类马里兰埃尔克顿次新世陆地卫星图像的颜色键。|
以透明的方式印刷。我们将这种透明度覆盖在重新校准的航空照片上,直到场模式大致匹配。以照片中的类标识为标准,我们在用于生成表13-2所示摘要信息的混淆矩阵中,正确分配给每个类的像素数量和分配给其他类的像素数量,列出佣金、遗漏和总体精度的错误。
|马里兰Elkton亚新世陆地卫星图像最大似然监督分类精度表。|
13-8: Why are the mapping accuracies for individual classes lower than that of the overall classification? `ANSWER <answers.html#13-8>`__
13-9: Discuss and explain what is meant by errors of commision and omission for corn. `ANSWER <answers.html#13-9>`__
13-10: List at least five scene-dependent sources of error for the above case. `ANSWER <answers.html#13-10>`__
当我们错误地将与一个类相关联的像素标识为其他类时,或者当我们不正确地将一个类划分为两个或多个类时,就会产生佣金错误。当我们仅仅不识别应该识别为属于特定类的像素时,就会出现遗漏错误。每个类的映射精度是显示区域内正确识别的像素数除以该数字加上佣金和遗漏的错误像素。为了说明,在表中,通过照片解释和地面检查将43个像素归类为玉米,我们将其中25个像素分配给陆地卫星分类中的玉米,留下18/43=42%作为遗漏误差。同样,在43个国家中,我们错误地将7个国家认定为玉米以外的国家,产生了16%的佣金错误。在我们通过参考“基本事实”来确定这些错误之后,我们可以通过选择新的培训站点并重新分类来减少这些错误,通过重命名课程或创建新的培训站点,通过组合它们或使用不同的分类器来减少这些错误。对于每一组更改,我们将迭代分类过程,直到达到可接受的最终精度。
主要作者:Nicholas M.Short,高级电子邮件: nmshort@epix.net