>>> from env_helper import info; info()
页面更新时间: 2024-04-09 09:07:11
运行环境:
Linux发行版本: Debian GNU/Linux 12 (bookworm)
操作系统内核: Linux-6.1.0-18-amd64-x86_64-with-glibc2.36
Python版本: 3.11.2
2.3. 读取遥感影像的信息¶
从GDAL提供的实用程序来看,很多程序的后缀都是 .py
,这充分地说明了Python语言在GDAL的开发中得到了广泛的应用。
2.3.1. 打开已有的GeoTIF文件¶
下面我们试着读取一个GeoTiff文件的信息。第一步就是打开一个数据集。
>>> from osgeo import gdal
>>> dataset = gdal.Open("/gdata/geotiff_file.tif")
既然已经将一个GeoTIFF文件打开为一个GDAL可操作的对象, 下面来看一下都能对其进行怎样的操作。
Python提供了 dir()
内省函数, 可以快速查看一下当前对象可用的操作:
dir()
函数可能是 Python 自省机制中最著名的部分了。它可以返回传递给它的任何对象的属性名称经过排序的列表。 如果不指定对象,则dir()
返回当前作用域中的名称。
>>> dir(dataset)[:3] + ['... ...'] + dir(dataset)[-3:]
['AbortSQL',
'AddBand',
'AddFieldDomain',
'... ...',
'__weakref__',
'this',
'thisown']
下面看一下如何获取文件的一些基本信息,需要用到下面的一些函数与属性。
dataset.GetDescription()
获得栅格的描述信息dataset.RasterCount
获得栅格数据集的波段数dataset.RasterXSize
栅格数据的宽度(X方向上的像素个数)dataset.RasterYSize
栅格数据的高度(Y方向上的像素个数)dataset.GetGeoTransform()
栅格数据的六参数。GetProjection()
栅格数据的投影
通过下面小节我们逐一解释一下。
2.3.2. 读取影像的元数据¶
从元数据的作用来看,它更多地是为工程服务的。 客观地说,GDAL对元数据的支持并不好, 它并没有直接的元数据处理接口, 更没有实现元数据的相关标准。 但是,GDAL已经提供了足够方便的函数,可以读取影像的一些信息, 从而方便对数据进行处理。 GDAL一般是以字典的形式对元数据进行组织的, 但是对于不同的栅格数据类型,元数据的类型与键值可能都不一样。
目前, 国际上对空间元数据标准内容进行研究的组织主要有三个,分别是欧洲标准化委员会(CEN/TC 287)、 美国联邦地理数据委员会(FGDC)和国际标准化组织地理信息/地球信息技术委员会(ISO/TC 211)。
如果要进行元数据处理,可以考虑将元数据信息写入到XML文件中。 这个问题扩展开来就不是本书关心的内容的,在此就不再多说了。
我们先来看一下最常用的GeoTIFF文件的元数据信息。 GDAL可以作为数据集级别的元数据来处理下面的基本的TIFF标志。
TIFFTAG_DOCUMENTNAME
TIFFTAG_IMAGEDESCRIPTION
TIFFTAG_SOFTWARE
TIFFTAG_DATETIME
TIFFTAG_ARTIST
TIFFTAG_HOSTCOMPUTER
TIFFTAG_COPYRIGHT
TIFFTAG_XRESOLUTION
TIFFTAG_YRESOLUTION
TIFFTAG_RESOLUTIONUNIT
TIFFTAG_MINSAMPLEVALUE (read only)
TIFFTAG_MAXSAMPLEVALUE (read only)
使用Python 打开数据来读取一下数据的信息:
>>> from osgeo import gdal
>>> dataset = gdal.Open("/gdata/geotiff_file.tif")
>>> dataset.GetMetadata()
{'AREA_OR_POINT': 'Area', 'PyramidResamplingType': 'NEAREST'}
>>> dir(dataset)[:10]
['AbortSQL',
'AddBand',
'AddFieldDomain',
'AddRelationship',
'AdviseRead',
'BeginAsyncReader',
'BuildOverviews',
'ClearStatistics',
'CommitTransaction',
'CopyLayer']
GetMetadata()
方法可以访问数据的元数据信息,元数据信息对于每个数据都是不一样的。
比如再打开另外一个文件:
>>> ds = gdal.Open('/gdata/lu75c.tif')
>>> ds.GetMetadata()
{'AREA_OR_POINT': 'Area',
'TIFFTAG_XRESOLUTION': '1',
'TIFFTAG_YRESOLUTION': '1'}
这个文件只对两个TIFF标志进行了定义,还有一个并不是TIFF标志定义的。
GetDescription()
获得栅格的描述信息¶
>>> dataset.GetDescription()
'/gdata/geotiff_file.tif'
看来这里的图像描述是图像的路径名, 但是这是和各种不同数据集相关的, 不同数据集有不同的描述。
获取栅格数目¶
栅格数据集是由多个数据构成的,在GDAL中,每一个波段,都是一个数据集; 不仅如此,栅格数据集还可能包含有子数据集,每子数据集又可能包含有波段。
先来看一下刚才打开的数据的RasterCount
:
>>> dataset.RasterCount
3
这是一个由7个波段构成的Landsat遥感影像。
再看一个MODIS L1B数据:
>>> mds = gdal.Open("/gdata/MOD09A1.A2009193.h28v06.005.2009203125525.hdf")
>>> mds.RasterCount
0
运行结果居然是 0
。这意味着当前的数据集 dataset
中的栅格数目是
0
。
实际上,MODISL1B的数据格式是HDF格式的,它的数据是以子数据集组织的,要获取其相关的数据的信息,需要继续访问其子数据集。
影像大小¶
栅格数据的大小指出了影像以像元为单位的宽度与高度。
>>> dataset.RasterXSize,dataset.RasterYSize
(1500, 900)
可以看出我们的影像大小。
获得空间参考¶
下面看一下如果从栅格数据集中获取其投影与空间参考信息。 更多的关于投影与空间参考的讨论,会在后面章节介绍。
GetGeoTransform()
地理仿射变换参数。
对于遥感影像来说,它需要在地理空间中进行定位。
在GDAL中,这有两种方式,其中一种是使用六个参数坐标转换模型。
这个模型的具体实现在不同的软件中是不一样的。 在GDAL中,这六个参数包括
左上角坐标 , 像元X、Y方向大小 , 旋转 等信息。 要注意,
Y
方向的像元大小为负值。
>>> ds.GetGeoTransform()
(1852951.7603168152, 30.0, 0.0, 5309350.360150607, 0.0, -30.0)
获得投影信息¶
使用 GetProjection()
函数,可以比较容易地获取数据集的投影信息。
但是对于什么是地图投影,以及如何在GDAL中实现,就不是这么容易了。
此处我们只是简单地运行一下,更详细的解释,会在后面章节中展开。
>>> ds.GetProjection()
'PROJCS["unnamed",GEOGCS["unknown",DATUM["unnamed",SPHEROID["unretrievable - using WGS84",6378137,298.257223563]],PRIMEM["Greenwich",0],UNIT["degree",0.0174532925199433,AUTHORITY["EPSG","9122"]]],PROJECTION["Albers_Conic_Equal_Area"],PARAMETER["latitude_of_center",0],PARAMETER["longitude_of_center",105],PARAMETER["standard_parallel_1",25],PARAMETER["standard_parallel_2",47],PARAMETER["false_easting",0],PARAMETER["false_northing",0],UNIT["metre",1,AUTHORITY["EPSG","9001"]],AXIS["Easting",EAST],AXIS["Northing",NORTH]]'
2.3.3. 使用GDAL获取栅格数据波段信息¶
上面我们介绍了针对数据集操作的主要函数。 但是如果需要了解栅格数据的更多信息,我们就需要看一下遥感图像处理中更常用到的波段操作的函数。
获取数据集的波段¶
GetRasterBand()
函数,可以获得栅格数据集的波段。这是函数的参数使用波段的索引值。
>>> from osgeo import gdal
>>> dataset = gdal.Open('/gdata/lu75c.tif')
>>> dataset.RasterCount
1
>>> band = dataset.GetRasterBand(1)
这里我们获取了第一个波段(红色值组成的表)。
注意!这里的波段获取和一般编程语言中数组下标的索引方式不一样,开始是
1
不是 0
。
查看波段的基本信息¶
下面我们现在来看看刚才读取出来的 band
有些什么东西可以供我们操作。
与操作数据集一样,GDAL同样提供了查看波段基本信息的函数。
>>> band = dataset.GetRasterBand(1)
>>> dir(band)[:6] + ['... ...'] + dir(band)[-3:]
['AdviseRead',
'AsMDArray',
'Checksum',
'ComputeBandStats',
'ComputeRasterMinMax',
'ComputeStatistics',
'... ...',
'__weakref__',
'this',
'thisown']
看一下常用的操作。这些也是用来获取波段的属性信息。
获取波段大小¶
>>> band.XSize, band.YSize, band.DataType
(6122, 4669, 3)
执行以上代码得到了波段图像的宽和高(像元为单位)。
对于我们所使用的影像, 这个与 dataset
中使用 RasterXSize()
与
RasterYSize()
获取的值一致。 DataType
是图像中实际数值的数据类型,表示 8
位无符整型。
获取波段数据的属性¶
>>> band.GetNoDataValue()
>>> band.GetMaximum()
>>> print(band.GetMinimum())
None
>>> band.ComputeRasterMinMax()
(-1.0, 66.0)
Maximum
是表示在本波段数值中最大的值,当然 Minimum
就是表示本波段中最小的值。
通过运行结果,我们可以看到在一开始RasterXSize()
和RasterYSize()
都没有值。
因为对于文件格式不会有固有的最大最小值。 所以我们可以通过函数
ComputeRasterMinMax()
计算得到。
注意!这里的最大最小值不包括“无意义值”! 也就是上面显示的
NoDataValue
。
2.3.4. 其他数据格式格式¶
使用GDAL读取ENVI数据格式¶
ENVI栅格文件格式
ENVI使用的是通用栅格数据格式,包含一个简单的二进制文件(a simple flat binary)和一个相关的ASCII(文本)的头文件。这也保证了单个ENVI栅格文件没有大小上限。
(1)头文件
ENVI头文件包含用于读取图像数据文件的信息,它通常创建于一个数据文件第一次被ENVI读取时。单独的ENVI头文本文件提供关于图像尺寸、 嵌入的头文件(若存在)、数据格式及其它相关信息。所需信息通过交互式输入,或自动地用“文件吸取”创建,并且以后可以编辑修改。 使用者可以在ENVI之外使用一个文本编辑器生成一个ENVI头文件。
(2)数据文件
通用栅格数据都会存储为二进制的字节流,通常它将以BSQ(band sequential,按波段顺序储存)、BIP(band interleaved by pixel,按波段像元交叉储存)或者BIL(band interleaved by line,按波段行交叉储存)的方式进行存储。
ENVI栅格文件必须包含着两个文件,其中头文件的后缀名为:.hdr,数据文件的后缀随意,甚至可以不带后缀名。 这两个文件是通过文件名来关联,即数据文件和头文件名称一致。
GDAL读取HDF数据格式¶
由于modis卫星数据跟我们经常遇到的geotif数据组织方式不一样,读取的时候一定要特别注意。geotif数据,一般是一个文件,包含了多个波段的数据; 而modis呢,一个文件包含了多各SUBDATASETSGDAL, 每个SUBDATASETS又包含多个波段数据。 另外默认编译的GDAL并不包含对MODIS数据支持, 需要单独下载针对HDF4,HDF5的源码,再修改下make.opt文件, 这时再编译GDAL,就支持modis数据的读写了。