摘要: 从空间数据的形式表达到空间数据的生成,从空间数据的处理变换到空间数据的应用,在这两个过程中都会有数据质量问题的发生。 (1)空间现象自身存在的不稳定性:包括空间特征和过程在空间、专题和时间内容上的不确定性。 (2)空间现象的表达:数据采集中的测量方法以及量测精...
从空间数据的形式表达到空间数据的生成,从空间数据的处理变换到空间数据的应用,在这两个过程中都会有数据质量问题的发生。
(1)空间现象自身存在的不稳定性:包括空间特征和过程在空间、专题和时间内容上的不确定性。
(2)空间现象的表达:数据采集中的测量方法以及量测精度的选择等受到人类自身的认识和表达的影响,这对于数据的生成会出现误差。
(3)空间数据处理中的误差:在空 间数据处理过程中,容易产生的误差有以下几种:投影变换产生的差异;地图数字化和扫描后的矢量化处理都可能出现误差;数据格式转换中的位置差异性;数据抽象时产生的误 差;建立拓扑关系过程中的位置坐标的变化;与主控数据层的匹配位移导致误差;数据叠加操作和更新产生空间位置和属性值的差异;数据集成处理产生的误差;数据的可视化产 生表达上的误差;数据处理过程中误差的传递和扩散
(4)空间数据使用中的误差:主要包括两个方面:一是对数据的解释过程,一是缺少文档,这样往往导致数据用户对数据的随意性使用而使误差扩散。数据质量控制是个复杂的过程,要控制数据质量应从数据质量产生和扩散的所有过程和环节入手,分别用一定的方法减少误差。
空间数据质量控制常见的方法有:
(1)传统的手工方法:将数字化数据与数据源进行比较,图形部分的检查包括目视方法、绘制到透明图上与原图叠加比较,属性部分的检查采用与原属性逐个对比或其他比较方法。
(2)元数据方法:数据集的元数据中包含了大量的有关数据质量的信息,通过它可以检查数据质量,同时元数据也记录了数据处理过程中质量的变化,通过跟踪元数据可以了解数据质 量的状况和变化。
(3)地理相关法:用空间数据的地理特征要素自身的相关性来分析数据的质量。