分布式地理信息系统

随着计算机网络的发展,基于客户机/服务器体系结构,并在网络支持下的分布式系统结构已经成为地理信息系统的发展趋势。由于GIS的固有的特点,使得运行于网络上的分布式系统特别适合于构造较大规模的GIS应用,其应用表现在以下几个方面:

  1. 数据的分布:在地理信息系统中,主要数据是空间数据,由于数据生产和更新的要求,常常需要存放在空间上分离的计算机上。

  2. 应用功能的分布:GIS的功能组成了由空间数据录入到输出的一个工作流程,不同的人员由于其关注的信息不同,需要不同的GIS功能服务对数据进行处理,将应用分布在网络上就可以解决该问题。

  3. 外设共享:外设的分布是服务分布的一种,由于许多GIS外设较为昂贵,如高精度平板扫描仪,喷墨绘图仪,大幅面数字化仪等,而通过分布式系统,可以实现这些设备的共享。

  4. 并行计算:在地理信息系统中,许多模型具有较高的时间复杂性,利用分布系统可以实现并行计算,缩短计算时间。

    下面将描述分布式系统以及一些网络地理信息系统的模式和实现。

分布式系统和C/S模型

分布式系统(Distributed System)的定义是:一组独立计算机的集合,但是从用户的角度来看,如同于一台计算机。较之于集中式系统(Centralized System)以及独立的微机系统,分布式系统具有以下优点(表13-1,表13-2):

表13-1:分布式系统的优势--与集中式系统比较[A. S. Tanenbaum]

项目

描述

经济

多个微处理器提供了更好的性能/价格比

速度

一个分布式系统比大型机有更好的总体计算能力

固有的分布

一些应用系统需要运行于空间上分离的机器

可靠性

如果一台机器崩溃,整个系统还能够运行

增量发展

计算能力能够以很小的增量增长

表13-2:分布式系统的优势--与微机系统比较[A. S. Tanenbaum]

项目

描述

数据共享

允许多个用户访问同一数据库

设备共享

允许多个用户共享昂贵的外设

通讯

使人与人之间的通讯变得简单,如电子邮件

灵活性

以最有效的方式将工作量分布在所有可用的机器上

在具有上述优势的同时,由于分布式系统的复杂性,对软件硬件提出了更高的要求,它也具有以下不足之处(表13-3):

表13-3:分布式系统的不足之处[A. S. Tanenbaum]

项目

描述

软件

当前支持分布式系统的软件较少

网络

网络可能充满了或者引发其它的错误

安全性

容易使得需要保密的数据被访问

客户机/服务器(C/S,Client/Server)模型是一种分布式系统结构,在该体系中,客户端通常是同最终用户交互的应用软件系统,而服务器由一组协作的过程构成,为客户端提供服务。客户机和服务器通常运行相同的微内核,一个客户机/服务器机制可以有多个客户端,或者多个服务器,或者兼而有之。客户机/服务器模式基于简单的请求/应答协议,即客户端向服务器提出信息处理的请求,服务器端接收到请求并将请求解译后,根据请求的内容执行相应操作,并将操作结果传递回客户端(图13-3)。客户机/服务器体系的优点在于简单和高效。HTTP、FTP等协议都是遵循客户机/服务器的模式。在网络地理信息系统的实现中,客户机/服务器模型是经常采用的一种方案。目前,将服务器分解形成数据服务器和应用服务器,形成三层结构,可以更好地区分数据访问操作和应用模型,这是经常被采用的一种结构。

../../_images/img_120.png

图13-3:客户端-服务器模型

网络地理信息系统的组合方式

在分布式的网络地理信息系统中,客户机和服务器分别由相应的软件、硬件以及数据库组成,其组合可以按照数据和应用功能的分布分成五种(表13-4):

表13-4:网络信息系统的组合方式[李斌]

组合方式

数据

应用功能

全集中式

中央服务器

中央服务器

数据集中式

中央服务器

客户端

功能集中式

客户端

中央服务器

全分布式

客户端

客户端

函数库分布式

客户端或者服务器

中央服务器存储,客户端动态连接执行

全集中式

全集中式的地理信息系统把软件、数据库管理系统和数据库全部集中在中央服务器上,客户系统只负责用户界面功能,即获得用户指令并传递给服务器,显示查询结果,提供系统的辅助功能(图13-4)。常用的客户设置有三种,第一种是以X-server为代表的,只负责表现逻辑的客户系统,所有的数据处理和运算均在服务器上执行,客户端由专门的X终端或者X模拟器通过X协议实现用户与服务器之间的通讯;第二种是以ArcView为代表的客户软件系统,这类系统除了提供一般的用户界面以外,还具有相当强的分析和处理功能。ArcView可以与ESRI的ARC/INFO、与作为服务器的SDE、Arcstorm,通过网络软件系统NFS或者网络API构成网络地理信息系统;第三种是目前在WebGIS上广泛采用的客户系统,用户界面功能由浏览器执行,WebGIS在后面还将进一步的描述。

../../_images/img_214.png

图13-4:全集中式网络信息系统[李斌]

数据集中式

网络系统专门设置集中的数据存储和管理服务,网络的其它部分成为数据客户,它们一般都是带有一定功能的地理信息系统软件(图13-5)。简单的数据服务可以由网络软件系统(如NFS)提供,大型的管理系统则需要功能完备和高性能的数据服务器,如Arcstorm和Oracle。由于目前许多数据库管理系统开始支持面向对象的数据模型,更加方便于空间数据的管理,以建立数据集中式的网络地理信息系统。

../../_images/img_313.png

图13-5:数据集中式地理信息系统组合模式[李斌]

(a)采用网络文件系统,(b)采用数据库服务器

功能集中式

与数据集中式相反,功能集中式的网络信息系统把绝大部分的功能集中在一个或者几个容量大、性能高的服务器上,由它们负责所有的分析和处理,数据则分散到客户端存储和管理(图13-6)。由于在大多数GIS应用中,数据量一般比较庞大,采用这种方式,会增加网络的传输量,从而降低整个系统的性能。

../../_images/img_47.png

图13-6:功能集中式的地理信息系统[李斌]

全分布式

全分布系统是原有的非网络化的信息系统自然进化的结果。在全分布系统中,各个子系统具有完备的数据库及地理信息系统软件和其它应用软件,在网络中同时扮演客户和服务器的角色。各个子系统的软硬件环境和特性及拥有的数据都很可能不一样,但同时又有很密切的联系和互补性。系统的集成,通过网络操作系统及各子系统提供的API实现。实现全分布式的网络地理信息系统,往往需要基于已有的系统平台进行二次开发,使它们能够相互协作。

函数库服务器

传统的软件系统一般是静态的,为了提供更多的功能,系统变得越来越大,而实际上,对于每一个用户而言,通常只是需要有限的几个功能,这样就造成了系统资源的浪费。对于集中式系统而言,系统的扩大将加大中央服务器的负担,造成系统性能下降,而全分布系统实现又较为复杂。函数服务器把优化的功能函数存储在服务器上,通过网络按用户要求动态合成应用软件,并使其在客户机上运行。从而从根本上改变了传统的资源分配和软件运行及维护方式。基于分布构件模型(CORBA或DCOM)构造的软件系统可以在一定程度上实现函数库服务器。

网络地理信息系统的概念设计

从逻辑上讲,基于用户的功能需求进行概念设计是大多数计算机网络软硬件配置设计的第一步。概念设计应当基于如下要点:

  • 对用户的应用意图有充分的了解;

  • 掌握计算机硬件和计算机通讯的基本概念知识;

  • 了解已经存在的并有可能影响设计的条件,包括现有软件系统以及通讯设施;

  • 对于有可能影响系统设计的计算机技术及其发展的现有状况应有充分认识。

概念设计应当对在地理信息系统网络配置中的硬件、软件的功能和作用给予说明,并对设备和应用之间的关系给予描述,应当能够在网络系统实现时,有利于系统功能重新审核以及修改,有利于系统价值的估算,并且为更详细的特殊定义提供基础,同时还应当对系统能够在新的应用、新的用户和扩展数据库方面给予描述。

进行网络地理信息系统概念设计时,集中式、分布式和处理功能必须与特定的地址条件、用户的应用需求相适应。下面给出了一些典型概念设计以及其说明。(表13-5)

表13-5:一些网络地理信息系统的概念设计描述

图示

系统和组织类型

地址分布

数据传输操作

升级可能性

适用于地方政府、工程单位的单个部门的少量用户用于数据获取、地图生产

单一地址

与其它已有站点之间的数据传输没有特殊的要求,数据可以通过磁带等介质或者进行批量传输

可以升级为基于主机的网络或者具有其它智能工作站的网络

作为小型多用户系统,用来支持数据获取、地图生产、数据库和图形查询应用,服务于政府机构或企事业单位的一个或几个部门

拥有大量外围处理单元被分配在一建筑物的一层或者相邻几层,远程用户通过拨号上网与系统连接

其它来源的数据可以通过磁带等介质或者直接进行批量传输

一些附加设备可以添加在异步端口上,可以升级为局域网

适用于中型到大型的政府或企事业单位的组织结构,用户通过进入大型主机数据库进行查询、分析和制图

在同一建筑物内,多个地址直接相连;新增加的工作站或其它设备可以通过远程联结与图形控制器以及通讯处理器相连

周期性数据交换可以通过磁带等介质进行,也可以利用网关与其它计算机网络进行传输,微机数据的传输容易建立

设备可以灵活增加以达到大型主机处理器的计算容量

用于小型到中型的政府部门或公司单位

分配于同一建筑物内

可以通过微机桌面传输装置或拨号上网来进行数据交换

增设的微机和服务器可以容易的添加到环形网络上

适用于需要大量制图与地理分析的中型到大型的政府、公共事业和公司单位组织的多个分组部门

同一建筑物内或者临近建筑物之间的局域网上,其它用户通过远程通讯线路与局域网相连

数据传输在网络上进行,远程通过批量数据文件或磁带交换,也可通过网关连接到其它网络

局域网可以通过中继器扩展到更大的地区,多个局域网可以通过网桥连接在一起

设置在局域网上,支持具有主机处理单元的多用户,适用于多部门背景

同一建筑物内或者临近建筑物之间的局域网上,其它用户通过远程通讯线路与局域网相连

以主机来维持主数据库,可以进行批量文件或磁带的数据传输

可以增加外设,工作站和处理单元直至达到网络限制,可以通过中继器扩展其它建筑物,多个局域网可以通过网桥连接在一起,可以增加网关连接多种网络

在局域网上配置多个处理单元和外设,以支持多个功能相关组织

处理单元和外设分布在多个建筑物内,有些设备通过远程线路与局域网相连

用户可以访问局域网上的分布式数据,可以通过网关进行其它网络的批量或实时数据访问

可以增加外设,工作站和处理单元直至达到网络限制,局域网扩展可以通过中继器或网桥实现

一个系统网络中的多用户数据共享,或者是需要较大数据处理能力的具有地理分布的某个组织

多个处理单元通过远程线路相连

单个地址的数据更新以批量文件方式进行,多个地址之间的相互访问依靠远程线路传输

每个地址都可以扩展,增加的处理单元可以加入到远程网络中

../../_images/img_54.jpg

图13-7:(一)拥有外设的超级微机工作站

../../_images/img_62.jpg

图13-8:(二)通过异步线路支持设备的基于主机的集中式系统

网络互连设备简介

  1. 中继器(Repeater):是最简单的网间连接器,提供对信号的放大和转发,它只能连接具有相同物理协议的LAN。中继器主要用于扩充LAN电缆段的距离,在同一个LAN中,也可以采用LAN延长介质长度。

  2. 网桥(Bridge):网桥是在数据链路层实现LAN互连的存储转发设备,它独立于高层协议,可以实现异构型局域网的互连。

  3. 路由器(Router):路由器工作在OSI模型的网络层,能够获得更多的网络信息,为来到的信息找到“最佳路由”。路由器结构比网桥复杂,速度也慢,但是具有更大的灵活性和更强的异种网络互连能力。

  4. 网关(Gateway):又称为协议转换器,工作在OSI模型的传输层及以上层,用于互连不同体系结构的网络或者媒体。它不仅要连接分离的网络,还必须确保从一个网络传输的数据与另一个兼容。

../../_images/img_71.jpg

图13-9:(三)通过通讯控制器支持外围设备的基于大型主机的系统

../../_images/img_81.jpg

图13-10:(四)令牌环网络微机系统

../../_images/img_91.jpg

图13-11:(五)局域网上具有超级微机工作站的分布式处理和数据库系统

../../_images/img_10.jpg

图13-12:(六)具有主处理器,超级微机工作站和外设的局域网

../../_images/img_112.jpg

图13-13:(七)具有多处理单元和中央数据存储的局域网

../../_images/img_121.jpg

图13-14:(八)具有分布式数据存储的远程处理

几种局域网技术标准:以太网,令牌环网和FDDI

IEEE(电气和电子工程师协会)确定了一些局域网的标准,统称为IEEE 802,包括CSMA/CD(带有冲突检测的载波侦听多路存取),令牌总线,令牌环,而FDDI(Fiber Distributed Data Interface,光纤分布式数据接口)应用于高速LAN。下面对几个常用的技术标准作以简单介绍。

  1. IEEE 802.3:CSMA/CD,采用CSMA/CD在局域网中访问和传输数据,假如一个节点要发出一条消息,那么首先检查通信信道,看是否正在进行数据传输。如果没有,就可以使用线路,发送自己的消息,否则必须等到信道空闲。如果两个节点同时试图发出消息,就会发生冲突,此时两个节点各自等待随机长度的一段时间,再重发上一条消息。在最早的802.3中,规定传输速率为10Mbps,使用50欧姆的电缆,后来这些都有所改变。因为其传输电缆的原因,很多人称之为以太网,其电缆有以下几种,如表13-6。

表13-6:通常的以太网电缆类型

名称

电缆

最大段长

每段最多节点

好处

10Base5

粗同轴电缆

500米

100

可以作为骨干线路

10Base2

粗同轴电缆

200米

30

价格最低廉

10Base-T

双绞线

100米

1024

易于维护

10Base-F

光纤

2000米

1024

可以用于建筑之间

  1. IEEE 802.4:令牌环网,在令牌环网中,有一个特殊的数据包,称为“令牌”,沿着网络从一个节点发送到另一个,该令牌包含着特殊的控制信号,使节点能够知道令牌目前是正携带着一条消息,还是处于空闲状态,可以接收一条消息。如果令牌空闲,同时节点需要发出一条消息,以“捕获”该令牌,并将自己的消息附加其中,随后该令牌就不能再携带其它消息,除非将目前的消息“投递”出去。

  2. FDDI:FDDI是高性能的光纤局域网,其传输速率为100Mbps,传输距离可达200KM,其间可以连接1000台工作站。FDDI的使用类同于IEEE 802规范的LAN。但由于其高带宽,可以作为连接铜质局域网的骨干网。