访问量: 1446 次浏览

地理空间人工智能(GeoAI)是一门新兴的科学学科, 它结合了空间科学、机器学习(如深度学习)中的人工智能方法、数据挖掘和高性能计算的创新, 从空间大数据中提取知识。
GeoAI 是高度跨学科的,连接了许多科学领域, 包括计算机科学、工程、统计学和空间科学。 GeoAI 的创新部分在于其解决现实世界问题的应用, 这对社会和经济产生了重大影响。 以下只是 GeoAI 众多应用的几个示例:
几十年来,机器学习一直是 GIS 空间分析的核心组成部分。 这些数据驱动的算法和技术已被用于解决三大类问题:数据的自动预测、分类和聚类。
机器学习和深度学习都在有限的人类参与下分析信息并预测结果。 计算机学习分析数据的方式是深度学习与一般机器学习的区别。
深度学习教会系统从数据中寻找什么来进行所需的分析。 这项任务是使用神经网络完成的, 神经网络模仿人脑处理信息的方式。 这些神经网络通过多层传递信息, 根据可识别的模式对数据进行过滤和分类。 目前 ArcGIS 中的深度学习模型使用一种特定类型的神经网络, 称为卷积神经网络(CNN)。
以下内容将重点讨论使用神经网络分析光栅图像并解释其内容, 这也通常被称为计算机视觉。 一般来说,所有深度学习工作流程都遵循相同的总体步骤:

除了用于处理图像的工作流程外, 还有其他可以在 GIS 中使用的深度学习工作流程。 以下是根据输入数据, 在 GIS 中使用深度学习可以完成的任务类型的概述。

ArcGIS中深度学习的工作流及其相关工具。
要在工作流程中实现深度学习, 可以使用或微调预先训练的深度学习包, 或训练自己的深度学习模型。 ArcGIS 还与第三方深度学习框架集成, 从单个图像、图像集合、点云或视频中提取特征。
以下是使用对象检测作为深度学习模型的计算机视觉的典型工作流程:

深度学习工作流示例。
在深度学习的情况下,图像解释最常见的任务可以分为4种类型:

1.图像分类(Image Classification)
这是最简单的任务, 计算机为整个图像分配一个标签, 例如 “dog” 或 “person”。 在 GIS 中, 图像分类可以用于标记带有地理标记的照片, 例如将区域的图片分类为城市或农村。
在上面图片示例中, 左边的数字照片可能被标记为“dog”, 右边的无人机图像可能被标记“受损建筑”。 这种类型的分类也称为对象分类或图像识别。 在 GIS 中,它用于对图像进行分类。
2.目标检测(Object Detection)
对象检测用于定位图像中的对象及其位置, 该过程通常会在位于图像内的特征周围产生边界框。 例如,使用左侧图像的计算机视觉, 能够检测到孩子和狗的位置。 在无人机图像中, 神经网络找到了一个体育场的位置。
在 GIS 中, 我们使用对象检测来定位卫星、航空或无人机图像中的特定特征, 并在地图上绘制这些特征的范围(边界框)。
3.语义分割(Semantic Segmentation)
语义分割是将图像上的每个像素分类为属于特定类别的过程。 在左侧的图像中, 构成狗的黄色像素被归类为狗, 而图像中的其他像素属于其他类别(绿色像素是树,棕色像素被归类于地)。
在右侧的图像中, 建筑像素与其他类别(如树木、草地和道路)分开分类。 这种类型的分类在 GIS 中通常被称为像素分类、图像分割或图像分类。
4.实例分段(Instance Segmentation)
实例分割是一种更精确的对象检测方法,其中绘制每个对象实例的边界。 例如,在左侧的图像上, 在图像上检测到儿童和狗, 但在这种情况下,描绘了每个对象的精确轮廓。 在右边,建筑物的屋顶被检测到, 可以区分校园里每栋建筑的不同形状。 这种类型的深度学习方法也被称为对象分割。
计算机视觉还有其他类型的深度学习应用, 如全景分割、图像翻译和变化检测等。
ArcGIS 预训练的深度学习模型使您能够通过提供强大的模型来加快地理空间工作流程, 从而消除对以下方面的需求:
预训练模型使您能够自动从图像、点云和视频中提取有意义的见解, 用于非常特定的场景, 如土地覆盖分类或屋顶提取。

上图为 Sentinel-2 Land Cover Explorer。