4.2. 数据规范化和标准化

现代信息社会数据共享是一个最基本的特点。GIS数据规范化和标准化直接影响地理信息的共享,而地理信息共享又直接影响到GIS经济效益和社会效益。为了解决利用已有数据资源并为今后数据共享创造条件,各国都在努力开展标准化研究工作,许多部门和单位都在纷纷建立自已的数据库。国家制定的规范和标准是信息资源共享的基础,任何标准和规范,不但有利于国内信息交流,也有利于国际信息的交流。但是目前空间数据标准化仍然存在不少问题,还缺乏统一的标准和规范,缺乏地理信息的法规,各部门间缺乏必要的联系和协调,对于科学的分类和统计缺乏严格的定义,建立的系统,数据杂乱,难以相互利用,信息得不到有效的交流和共享。为使数据库和信息系统能向各级政府和部门提供更好的信息服务,实现数据共享、数据规范化和标准化建设是一项十分紧迫的任务。

4.2.1. 统一的地理基础

地理基础是地理信息数据表达格式与规范的重要组成部分。它主要包括统一的地图投影系统、统一的地理坐标系统以及统一的地理编码系统。通过投影坐标、地理坐标、网格坐标对数据进行定位。各种来源的地理信息和数据在共同的地理基础上反映出它们的地理位置和地理关系特征。

地理信息系统之所以区别于一般的信息系统,就在于它所存储记录、管理分析、显示应用的都是地理信息,而这些地理信息都是具有三维空间分布特征且发生在二维地理平面上的,因而它们需要有一个空间定位框架,即共同的地理坐标和平面坐标系统。所以说统一的坐标系统是地理信息系统建立的基础。

4.2.2. 统一的分类编码原则

现代科学技术日新月异,除了传统的学科外,产生了很多边缘学科和交叉学科。各学科信息丰富多彩,因此,把数据输入计算机建立GIS,必须以明确的分类标志、统一的标准,对信息进行分类编码。分类过粗会影响将来分析的深度,分类过细则工作量很大,计算机存贮量很大。分类编码应遵循科学性、系统性、实用性、统一性、完整性、可扩充性等原则,既要考虑信息本身属性,又要顾及信息之间的相互关系,保证分类代码稳定性和唯一性。国家规范组建议信息分类体系采用宏观的全国分类系统与详细专业系统之间相递归的分类方案,即低一级的分类系统必须能归并和综合到高一级分类系统中去。

4.2.3. 数据交换格式标准

数据交换格式标准是规定数据交换时采用的数据记录格式,主要用于不同系统之间数据交换。GIS软件或数据并不是一次性的,也不是一个小部门单独使用,而是多次使用,相互共享。一般属性数据库仅有几种固定的数据类型,如事务管理系统,因此数据转换问题比较简单。但是空间数据与之不同,除了起说明作用的属性数据外,还有起定位作用的空间数据,因此数据共享异常复杂。但是总的原则是: 制定的数据交换格式应尽量简单实用,能独立于数据提供者和用户的数据格式、数据结构和硬软件环境,数据格式应便于修改扩充和维护,便于同国内外重要的GIS软件数据格式进行交换,保证较强的通用性。GIS要从项目应用走向企业应用和社会,在当前GIS软件数据格式较多的情况下,应制定一个数据交换格式标准,并将国家的基础空间数据转换成这一标准,逐步向全国各行业推广。

4.2.4. 标准的数据采集技术规程

我国现已研究和制定了两个技术规程: 图形数据采集技术规程和摄影测量数据采集的技术规程。规程中对设备要求、作业步骤、质量控制、数据记录格式、数据库管理及产品验收都作了详细规定。在地矿系统GIS应用中,还应研究和制定遥感影像数据采集技术规程、地质数据采集技术规程等。

4.2.5. 数据标准化所面临的问题

数据标准化问题虽然被许多有远见的科学家从一开始就提出来了,而且随着地理信息系统广泛应用,这种标准化要求的呼声不断提高,其目的在于使地理数据得以在更广大的范围内共享。但是,数据标准化问题直接受到传统地理学研究成果的制约,许多概念上的争论,例如土壤分类、地貌分类、土地利用分类等等,已经讨论了几十年,有的已基本上统一了认识,例如发表了1∶1 000 000地貌图制图规范,1∶1 000 000土地利用制图规范,而土壤分类未有任何统一的结论。分类问题不解决,制定数据标准也就失去了基础,企图依靠地理信息系统技术来统一认识显然是实现不了的。但是,每一个地理信息系统,必须设计自己的数据标准,这样就造成了目前地理数据的共享问题在我国显得十分困难。

数据标准化面临的另一个重要问题是数据模型的标准化。世界上最著名的几个地理信息系统软件,采用了完全不同的数据模型,例如ARC/INFO使用了网络和关系的混合模型,TIGER系统采用的拓扑结构有其自己的特点。它们对数据模型化的处理方法截然不同,反映了对地理实体的认识差异。这两类系统均拥有广大用户,这种事实表明了要实现数据模型的标准化为期更远。但是,我们看到了这样的事实,即数据模型的不统一并没有限制数据共享,因为在众多的系统中都开发了能接受外部数据的软件,即数据格式转换软件;同时某些公认的数据格式,例如DXF,Line Postscript等等,正在形成数据交换的国际标准。