4.3. 数据输入

数据输入是对GIS所管理、处理的数据进行必要编码和写入数据库的操作过程。任何GIS都必须考虑空间数据和属性数据(非空间数据)两方面数据的输入。由于GIS数据种类繁多,精度要求高而且相当复杂,加上受到计算机发展水平的限制,在相当长一个时期内,手工输入仍然是主要的数据输入手段。随着计算机、通讯等信息技术的不断发展,数据采集和输入方式也呈现出多样化,而且数据采集和输入的自动化程度也越来越高。当然,GIS数据采集和输入需要投入极大的工作量,几乎占据建立整个系统工作量的一半以上。GIS应用致命问题是所有输入的数据都必须转换为与特定系统数据格式相一致的数据结构,因此迫切需要通过先进的计算机全自动录入或数据采集技术为GIS提供可靠的数据。现在已经形成标准数字地理数据集合格式,数据转换的自动方法已经开始使用,数据采集的数字方法已能直接用于产生数字文件。

4.3.1. 野外数据采集

4.3.1.1. 平板仪测量

平板仪由平板和照准仪组成。平板又由测图板、基座和三脚架组成;照准仪由望远镜、竖直度盘、支柱和直尺构成。其作用同经纬仪的照准部相似,所不同的是沿直尺边在测图板上画方向线,以代替经纬仪的水平度盘读数。平板仪还有对中用的对点器,用以整平的水准器和定向用的长盒罗盘等附件。平板仪测图实质上是一个光学模拟过程,即靠的是光学仪器,手工操作实现对中,整平,定向、照准、画线、描图等一系列制图作业方式,一切完全靠手工操作,野外劳动强度大,生产作业经费较高,同时由于受仪器设备的限制,对高差大及老城区复杂的地形适应性差。其作业方式如图4-1所示(黄晓忠等,2001)。平板仪测图的成果一般是一张图纸。因此,需要通过各种输入设备(如扫描仪或数字化仪)完成图数转化的过程,将图形信号离散成计算机所能识别和处理的数据信号,然后输入到GIS中进行管理。

4.3.1.2. 全站仪测量

全站型电子速测仪简称全站仪,它是一种可以同时进行角度(水平角、竖直角)测量、距离(斜距、平距、高差)测量和数据处理,由机械、光学、电子元件组合而成的测量仪器。由于只需一次安置,仪器便可以完成测站上所有的测量工作,故被称为“全站仪”。全站仪包含有测量的四大光电系统,即水平角测量系统、竖直角测量系统、水平补偿系统和测距系统。通过键盘可以输入操作指令、数据和设置参数。以上各系统通过I/O接口接入总线与微处理机联系起来。微处理机的主要功能是根据键盘指令启动仪器进行测量工作,执行测量过程中的检核和数据传输、处理、显示、储存等工作,保证整个光电测量工作有条不紊地进行。输入输出设备是与外部设备连接的装置(接口),它使全站仪能与磁卡或微机等设备能进行交互通讯、传输数据。全站仪配合电子手薄便携机等进行外业数据采集,然后把外业采集的数据通讯到计算机中去,利用相关的绘图软件加以处理自动生成地物、地貌。同时把外业采集的各种特征点的数据保留下来以利于修改。其作业方式如图4-2所示(黄晓忠等,2001)。

image2 image3

图4-1 平板仪测图作业流程                       图4-2 全站仪测图作业流程

4.3.1.3. GPS测量

近年来,GPS已越来越多地应用于GIS的野外采集数据源。GPS地面接收器(现多为手提式)根据来自GPS卫星的信号计算地面点的位置。普通GPS接收器的精度在10米到25米之间,差分式(differential)GPS技术则可以测得精度非常高的数据。差分式GPS技术使用两台GPS接收器,一台安置在已知精确坐标数据的地点、称为参考站(base station),一台则用于量测地面未知点,称为使用者接收器(roving receiver)。如果两台GPS接收器以相同的方式设置,使用同样的几颗卫星计算位置,那么它们记录的位置误差应当是相等的,根据地面参考站接收器接收的数据计算误差,将使用者接收器获取的数据减去这一误差就可获得很高精度的位置数据,一般可达到厘米级的精度。大多数GPS接收器将采集的坐标数据和相关的专题属性数据存储在内存中,可以下载到计算机利用其他程序作进一步的处理,或直接下载到GIS数据库中,许多还可以将坐标数据直接转换成另一地图坐标系统或大地坐标系统。使用GPS,可以在行走中或驾车采集地面点的坐标数据,为GIS的野外数据采集提供了灵活和简便的工具。

4.3.2. 地图数字化

空间数据主要指图形实体数据。空间数据输入则是通过各种输入设备完成图数转化的过程,将图形信号离散成计算机所能识别和处理的数据信号。通常在GIS中用到的图形数据类型包括:各种地图、航天航空像片、遥感数据、点采样数据等。应该注意的是没有统一而简单的方法来输入这些图形数据,只有一些普遍适用的方法供GIS用户选择使用。用户可以依据如何应用图形数据、图形数据的类型、现有设备状况、现有人力资源状况和经济状况等因素综合考虑,选用单一方法或几种方法结合起来输入所需要的图形数据。

空间数据的采集可以说是长期制约地图数据库与地理信息系统建设的“瓶颈”,也是当前国内外研究的热点和难点。实现空间数据的快速采集与更新,必须解决三个问题:一是图形图像识别的智能化;二是多种信息源数据采集的技术集成;三是数据资源的共享。其中,难度最大、最迫切需要解决的是第一个问题。

目前,图形图象识别的智能化已有一些进展,尤其是已有一批扫描地图数字化软件投入市场,并得到广大用户的认可。栅格数据矢量化的算法思想也有所突破,还出现了可对彩色图象进行矢量化的软件(如MAPGIS软件就有此功能)。但目前对特殊线型的矢量化,对有交叉线的矢量化还不够尽人意,有待进一步研究。

1.扫描仪简介

除少数特殊产品外,绝大多数扫描仪是按栅格方式扫描后将图像数据交给计算机来处理。扫描仪可分为滚筒式(卷纸)、平板式、CCD直接摄像式三种,其中大幅面的地图以滚筒(卷纸)式用得最多。目前市场上常见的A0幅面的滚筒式单色分灰度扫描仪的分辨率为400~800dpi(即每英寸400~800点,大约相当于每毫米15~30点),这比手扶跟踪数字化操作的精度要高。普通的扫描仪大都按灰度分类扫描,高级的可按颜色分类扫描。

因光学、电子、机械技术的发展和相互作用,扫描仪的成本正在迅速下降,但扫描仪要比数字化仪昂贵得多。

2.扫描数字化前准备

① 原图准备

由于扫描数字化是采样头对原图进行扫描,凡扫到需要色(对黑白地图来说,黑色为需要色,对彩色地图来说,对哪种颜色扫描,那种颜色就叫需要色)就记录一个数(例如“1”),扫到不需要色就记录另一个数(例如“0”)。为提供扫描数字化,首先要选择色调分明,线划实在而不膨胀的地图作为原图;其次要在图上精确划定数字化的范围,标出坐标原点;最后要清理图面,如修净污点,连好线划上的断头。这样才可固定在滚筒(滚筒式扫描机)或平台(平台式扫描机)上,作为扫描原图。

② 选择数据记录格式

扫描数字化仪的数据记录格式有两种,一种是数字格式,也就是每个网格记录一个二进制数“0”或“1”,它适用于对黑白或彩色线划地图数字化;一种是连续格式,每个网格记录一个灰度值(0~255个灰阶),这适用于对像片数字化。因此要根据原图的形式选择数据记录格式,并在控制柜的面板上安排好。

③ 选择光孔的孔径

扫描仪采样头中透光孔的孔径有好多规格,例如:

12.5μ×12.5μ

25μ×12.5μ

50μ×25μ

50μ×40μ

100μ×100μ

(μ(微米)=1/1000毫米),它用来控制网格的大小,也就是用以控制分辨率,孔径越小,网格就越小,分辨率就越高,数据量也就越大。根据地图的精度要求,应选择具有一定的分辨率,数据量又不致过大的孔径。通常选择100μ×100μ(或50μ×40μ)的孔径,即地图上0.1毫米粗的线划一般只占1至2个网格。

④ 计算坐标差

当原图经过定向,固定在滚筒(或平台)上之后,要算出扫描仪原点和原图原点之差,以便控制记录装置。

3.栅格扫描数据到矢量数据的转化

栅格到矢量的转换计算主要用于将像元阵列变成线数据,将栅格扫描数据变成文本和线划,当栅格数据用笔式绘图仪输出时,也需首先转换成矢量数据。

从扫描仪输出的数据由一系列记录图像存在或不存在的像元组成。这种数据的矢量化处理比一般栅格数据的矢量化处理要复杂些。首先要用一种统称为细化处理的算法在扫描得到的密集像元形成的“肥胖”线划中贯通一条细线,此线被认为是原图上的线。其次细化处理时产生的线还包括比实际需要多许多的坐标对,还须用“剔除”算法去掉,以节省宝贵的存贮空间。同时还要人机交互式地处理线划间断、重叠等问题。

普通线化地图的扫描后矢量化,其处理过程大致如下(图4-3):

image26

图4-3扫描并自动矢量化的过程

  1. 对扫描后的图像作手工编辑,去掉不需要的要素杂点,不清楚的地方作简单修补。
  2. 由软件将栅格数据转换成矢量(线化)数据,同时进行灰度、颜色、符号、线型、注记的识别,这一处理过程(特别是符号、注记的识别)往往花费较多的计算时间。
  3. 再由手工对转换后的矢量图形进行编辑,使之符合GIS数据库的要求。

4.其它类型的自动数字化仪器

为了满足大量幅面大、内容又复杂的数字化材料的快速数字化要求,在上述扫描仪的基础上发展了一些新型数字化仪器。人们之所以对自动扫描如此感兴趣,主要原因是在一定程度上来说数字化是传统制图过渡到数字成图的重要问题之一。

(1)视频数字化仪

到目前为止已研制了多种简单的视频数字化仪,主要用于数字化航片上判读出来的边界信息,或者将整张航片栅格化处理。这些数字化仪包括与微电子装置连接在一起的视频摄像机,把电视画面的模拟量转变成栅格化数字影像。

这些简单的视频数字化仪,主要用于航片上道路和其它线性物体的数字化,数字化结果直接输入遥感图像分析系统。

(2)解析测图仪

用立体测图仪自动获取数据的第一次改进是在机械绘图桌上装上电子机械X、Y、Z记录器,再将记录器与纸带穿孔机连接把记录到的数据穿孔,立即得到三维坐标,立体测图仪也就变成了三维数字化仪。这种初级三维数字仪初次尝试取得一定的成功后,完全新型的解析测图仪发展起来了,用这类仪器不仅能记录三维坐标,还能通过连网的微机处理比例尺变形和其它制图变形,处理后的数据以直接处理的形式记入硬盘上。这类仪器的应用正在增加,是三维数据获取的最佳方式,除用于测图外,还能与综合制图系统接口。

4.3.3. 数字摄影测量

传统的摄影测量是利用光学摄影机获取的相片,经过处理以获取被摄物体的形状、大小、位置、特性及其相互关系的一门学科。现代数字摄影测量是对非接触传感器系统获得的影像及其数字表达进行记录、量测和解译,从而获得自然物体和环境的可靠信息的一门工艺、科学和技术。摄影测量的发展经历了模拟摄影测量、解析摄影测量和数字摄影测量三个阶段。

image25

图4-4模拟摄影测量作业过程     图4-5解析摄影测量作业过程 图4-6数字摄影测量作业过程

模拟摄影测量这一发展阶段是从1851年到1970年,它是利用光学或机械投影方法实现摄影过程的反转,它通常用两个或多个投影器模拟摄影机摄影时的位置和姿态构成与实际地形表面成比例的几何模型,通过对该模型的量测得到地形图和各种专题图。其作业流程如图4-4所示,因此,由模拟摄影测量得到的地形图和各种专题图需要进行数字化后输入到GIS数据库中。

随着计算机技术的发展,摄影测量由模拟法逐渐向解析法过渡。解析摄影测量是以电子计算机为主要手段,通过对摄影相片的量测和解析计算方法的交会方式来研究和确定被摄物体的形状、大小、位置、性质及其相互关系,并提供各种摄影测量产品。德国人斯密特于20世纪50年代建立了解析摄影测量的基本理论,这一理论随即应用于解析空间三角测量。解析空中三角测量能很好地处理像点坐标的系统误差和粗差,保证了成果的高精度和高可靠性。另外,1957年美国的海拉瓦提出了解析测图的思想,并于60年代初研制成第一台解析测图仪。解析测图仪是根据数学关系式来建立立体模型,可以预先作各种系统误差的改正,而且它可以处理各种类型的像片,扩展了摄影测量的应用领域。其作业流程如图4-5所示,由解析摄影测量得到的数字线划地形图和数字高程模型可以直接输入到能支持该数据格式的GIS数据库中,由解析摄影测量得到的影像地图等非数字产品需要进行数字化后才能输入到GIS数据库中。

随着计算机技术的进一步发展和数字图像处理、影像匹配、模式识别等技术在摄影测量领域的应用,摄影测量开始进入数字摄影的测量阶段。它通过对所获取的数字或数字化影像进行处理,自动提取或人工干预的方式提取被摄对象,并用数字方式表达的几何与物理信息,从而获得各种形式的数字产品和目视化的产品。美国于20世纪60年代初研制成全数字自动化系统DAMC,它是把模拟的像片进行扫描转换成由灰度表示的数字影像,利用了计算机代替人眼进行立体观测,实现摄影测量的自动化。数字摄影测量与模拟、解析摄影测量的区别在于它不再依赖精密而昂贵的光学和机械仪器,处理的原始资料是数字影像或数字化影像,处理过程中以计算机视觉代替人眼进行立体观测,实现几何信息和物理信息的自动提取,其产品的形式是数字的,包括数字地图、数字地面模型、数字正射影像和数字景观图等。其作业流程如图4-6所示,由解析摄影测量得到的数字线划地形图、数字高程模型以及数字影像图可以直接输入到能支持该数据格式的GIS数据库中。

4.3.4. 遥感影像处理

遥感是在不直接接触的情况下,对目标物或自然现象远距离感知的一门探测技术。具体地讲是指在高空和外层空间的各种平台上,运用各种传感器获取反映地表特征的各种数据,通过传输、变换和处理,提取有用的信息,实现研究地物空间形状、位置、性质及其与环境的相互关系。将遥感技术与计算机技术结合,使遥感制图从目视解释走向计算机化的轨道,并为GIS的地图更新、研究环境因素随时间变化情况提供了技术支持,也是GIS获取数据源的一个重要手段。

由于遥感影像获取的平台、方式等各异,会出现各种各样的误差,不同的应用中所关心的对象不一,因此遥感影像必须通过计算机进行一定的处理才能为GIS等软件应用。利用计算机进行遥感图像处理的图像必须是数字图像,以摄影方式获取的模拟图像必须用图像扫描仪等进行模/数(A/D)转换;以扫描方式获取的数字数据必须转存到一般数字计算机都可以读出的CCT等通用载体上。遥感影像处理系统是由硬件(计算机、显示器、数字化仪等等)和软件(具有数据输入、输出、校正、变换、分类等功能)构成,影像处理的内容主要包括校正、变换和分类等。其中校正有几何校正和辐射校正,图像变换主要是用于改善图像视觉效果的增强处理和便于进行图像判读及分析特征提取处理,图像分类主要是利用物体的光谱特性对单个像元或比较匀质的像元组给出对应其特征的名称。这样,遥感影像经过相应处理后可直接输入到GIS数据库中进行管理。

4.3.5. 现有数据转换

任何信息系统总要利用已有数据,以减轻信息收集、编码、输入的工作量。除了利用本单位、本部门的现成资料外,常用的、通用的数据供社会共享已成为一种趋势。特别在发达国家,有很多政府机构或私人公司已经开始向社会公开提供数据服务,这种服务大致有五类信息:基本数字化地图、自然资源数据、地面数字高程、遥感数据、与人口统计相结合的空间、属性、地址数据。这些数据服务可以减少在数据收集与数据输入方面多付出的劳动,对GIS普及将起到了有力的促进作用。

现有的数据转换输入从计算机的角度来看难度虽不大,但在技术上须解决分类、编码、格式等标准化问题。特别是卫星遥感得到的数据,其格式不一定与资源环境信息系统数据库的一致,还需进行各种必要的预处理才能输入数据库。这些预处理包括调整分辨率和像元形状、地图投影交换、数据记录格式等,使数据保持与数据库的要求一致。还有一个特殊问题是与地形数据如道路、各类边界的匹配和定向问题,特别是早期的低分辨率卫星图像的定向。虽然可以从陆地卫星图像上推知它的定向和定位元素,但因像元过于粗大而不能精确定位,与其它数据配合使用应注意分辨率的匹配。预处理可能包括数据简化处理,例如把几个波段简单地合成或其它基本变换多波段数据组合在一起,然后进行土地利用或其它类别的分类,最后把分类结果输入数据库可大大减少数据容量,这样的预处理操作是在图像分析系统中进行的。