2. 概述

2.1. 问题:地理数据处理无交互性

地理数据是用来描述与地球表面时间和空间位置有直接或间接关系的现象的信息,这些信息的数据化采集方式已有30多年历史。随着技术的进步,如高分辩率卫星成像、全球定位系统,同时也随着采集和使用地理数据的人或组织的增多,地理数据的采集率迅速增长。信息技术工作者逐步意识到用地理位置来检索数据是组织和使用数字式数据的基本方法,因此地理数据的采集率还将继续增长。

表1-1 地理数据的质量和地理数据采集率

在过去的25年里,已经开发了很多查询、贮存、分析和查看地理数据的方法,这些方法彼此独立,本书中所写的地理数据是指所有以数字形式存贮的地理信息,例如包括如下几个方面:

数字地图,其中区域如土壤类型区、行政区、某一区域范围内平均家庭收入、选票区和其它有边界的实体由矢量包围的区域即多边形来表示。

“栅格”影像数据,如多光谱土地资源卫星影像和SPOT影像、数字正射影像、多边形土地利用栅格数据、任意试验区域内土壤氮含量级别。

点矢量数据,如测量控制点、水井、无线天线、独立树、那些易被雷电击中的地点、GPS跟踪的卡车或巡逻车位置、数字黄页中最近的硬件存贮器或数学辅导。

线矢量数据,如交通分析系统中的高速公路、所有权勘定中的界限或范围、输气管和了卫星移动电话微波通讯线路。

三维现象的夭量表示法,如垃圾堆下土壤污染程度的统计预测、飞行模拟器数据库中的虚拟地形、飓风模拟、从地面控测雷达测得的地球外属性模型和用于城市应急办公室的设备模型中的石油精炼设备。

空间或时间数据,如显示随着城市蔓延,农田损失的动态时间系列、随着时间的变化,河口排污的水深模型以及放在冷冻运输机上的GPS接收器的跟踪记录。

地理数据格式趋向于复杂化,因为它们代表的信息范围更广,所以比其它数字式数据格式更复杂。通常,它的复杂性是由特殊软件应用程序或采集方法决定的,这些程序或方法因为高水平的描述、转换和个人或组织的规则以及软件应用的规则增加了复杂性。

使用和建立地理数据的软件本身就各不相同而且很复杂,我们把地理数据处理定义为利用地理数据进行各种数字化计算,如地理信息系统(GIS)、土地信息系统(LIS)、地球影像和图像处理、各种数据库中地理数据的贮存、数字化测量、导航、气象学、地震学、利用地理数据的计算机辅助绘图(例如设施管理、国内工程)、交通运输管理、数字绘图、商业地理、飞行模拟等很多种类。地理数据处理软件帮助用户回答如下问题:某事物的位置、某种情况或空间关系情况发生的位置、一个给定的时间段中什么发生了变化?最佳路线是什么?如果某个环境状况发生变化会怎么样?

因为人们对环境问题越来越关注、而且有用地理数据和地理处理工具的激增,政府和商务所承受的压力更大,从不同来源集成地理数据变得越来越重要。数据共享的原因很简单,我们只有一个地球。以上列出的所有地理数据实例可以指同一城市中的地理属性。在地理区域上只有一个西班牙,但在数字主题图中有许多个西班牙,它们分别代表不同的物质、文化和经济主题。在许多领域,人们都需要自己的专题图并通过GIS中把它们与其它专题图结合起来完成以上提到的任务。因此我们必须共享数据,但数据的共享很麻烦且容易出错,有时根本不能实现。

想想这个假设但又是现实中的例子:美国环境保护组织收集Massachusetts(麻萨诸塞州)和Worcester关于土壤污染的信息,为什么Worcester卫生部或麻萨诸塞州环境保护部能使用它们自己的计算机获得信息并利用这些信息来分析而得出报告结果?

以下是上述例子的原因:

这三个部门可能用的是不同的GIS软件平台,建立和使用三种不同的数据格式,也就是说,不同的数据格式如AutoCAD的数据格式与微软Excel的数据格式是不一样的,这就涉及到“数据转换”问题。在“不同GIS平台”间,把EPA的数据格式转换成MEPD或WHD能使用的数据格式很麻烦,但用由一个或几个软件平台厂家共同支持的翻译器可以实现这一转换。与AutoCADt和Excel间交换数据一样,EPA数据格式转换成MEPD或WHD的数据格式时某些信息可能被丢失,因为两个系统的数据表达方式不完全相同。

假设三个机构运行同一版本的GIS软件(在同一硬件平台的同一操作系统中就能排除一些其它的潜在技术上的障碍),我们可以肯定EPA会使用与其它州或地方机构不同的方法或标准来采集信息。因此,如果MEPD和WHP可以单独地采集污染数据,这些数据就不能与EPA数据通用。温度和土壤湿度信息按贯例由MEPD来采集,不由EPA采集,尽管其它所有取样参数都相同。但数据还是会存在着某些差别,MEPD数据采集者需要调整他们的分析器重新进行计算。EPA采集的温度可能以摄氏度为单位,但WHD以华氏为单位;而且EPA采用径纬度坐标参考系,但MEPD用的是国家平面坐标系。可以通过坐标转换软件来进行坐标系的转换,当然也可以进行温度的转换(可能会用到少量的宏指令编程),但这种转换很麻烦,可能引发错误。或许EPA开始采集土壤温度数据时记录了这种采集方法,但采集和表示土壤湿度的方法有很多,以前WHD的数据收集方法没有记录下来,而且WHD对他们的数据可能会有错误的估计,这种错误估计的影响又怎样计算呢?

制度上、经济上和法律上的障碍:EPA可以保存和出版包括坐标系、土壤取样参数和土壤湿度测量方法的“元数据”吗?EPA不知道用户是用半英寸磁盘、CD-ROM还是通过WEB网页来获取他们的数据?EPA是否可以获得数据查询和管理的费用?WHD购买了数据后,它可以与其它个人咨询者共享这些数据吗?

这个简单的例子说明了美国政府为何每年花4亿多美元用来转换数据,欧共体在制度上与美国有更大的差异,面临着更复杂的数据转换问题。我们广义地称这些障碍为“无交互性”。全球范围内,只要建立和使用地理数据的地方,人们都面临着这些问题。

2.2. 开放GIS规范:对整个行业问题的回答

开放GIS协会(OGC)—-一个公益的行业协会,致力于促进地理数据处理方法的新技术和商业方法的互操作,它成立于1994年,当时已经广泛认识到了无交互性的问题以及它对行业、政府和学术界的许多负面影响。OGC的成员都有一个有关国际和全球信息基础设施的乐观设想,地理数据和地理处理数据源能自由访问,完全与最新的分布式计算机技术集成,每个人都可以自由访问,“可用的地理数据”—-一个目前还没有进入地理数据处理方法领域内,但是一个涉及范围很广的活动,开拓了新的市场、带来了新的商机、给社会带来新的利益。地理数据处理软件厂家、数据库软件厂家、可视化软件厂家、系统集成者、计算机厂家、通讯公司、大学、信息提供者和正版软件经销商都加入了协会共同制定软件规范、进行新的商业策划来帮助解决这些问题,实现潜在功能。

OGC的软件规范就是开放GIS规范,它是一个通用的分布式访问地理数据和地理处理数据源的软件结构规范。开放GIS规范为全世界的软件开发者提供了一个详细的通用的界面模板,这个模板可以与由其它软件开发者开发的开放GIS软件进行交互操作。如本书以后几章所描述的开放GIS框架包括:

  • 数学上、概念上用数字表示地球和地球现象的通用方法。
  • 执行访问、管理、处理、表示和在信息协会间共享地理数据的通用模式。
  • 使用开放地理数据模型和开放GIS服务模式来解决技术和制度上无交互性问题的框架。

开放GIS规范将在几年时间内分几个部分完成和发布,如本章所讲,它包括总体规范和一系列执行规范,以便在不同的已经完成和正在开发的分布式计算平台(DCPs)上执行,它包括对象管理组(OMG)开发的通用对象请求代理程序、微软开发的对象链接和嵌入以及通用对象模型(OLE/COM)、开放软件基金会开发的分布式计算环境(DCE)、SunSoft开发的Java等等。

表1-2 开放GIS规范在构成地理处理方法上所起的作用:

表1-2说明了开放GIS规范是建立在通讯技术和客户服务技术(包括DCP技术)基础上的,OGC一致同意建立开放GIS规范,使软件厂家提供带有即插即用地理数据处理工具接口的软件,集成者可以用这些工具为信息系统建立地理数据处理功能,计算机界正向组件式软件和网络计算机上发展,开放GIS接口能使地理数据处理方法取得进展。

通过OGC与国际标准技术委员会(它参与了地理空间、ISO TC/211标准的制定)的密切合作,开放GIS正逐步成为一个正规的国际信息技术标准。在开放GIS规范成为权威上的标准之前,厂家和其它OGC成员已经在商业软件产品、商业集成工程、政府数据中心和学术研究机构中已使开放式GIS规范成为一个独一无二的标准。因为它已经与商业软件结合,致力于地理数据处理方法的互操作和地理数据的共享,所以开放GIS规范很可能在将来很长一段时期内成为互操作地理数据处理方法的基础。