机器学习(ML)的兴起:如何在GIS中使用人工智能

Machine Learning ML Artificial Intelligence AI in GIS

GIS中的机器学习与人工智能

你可能听说过 机器学习(ML) . 但是你不确定如何在GIS的环境中使用它。

简单地说,机器学习是有意义的,从嘈杂的数据发现模式,你永远不会认为存在。换句话说,是软件编写软件。

ML没有应用预先构建的函数,而是通过重复看到的条件来获得经验,并构建一个模型来应用于新的情况。

例如,谷歌可能使用贝叶斯分类来过滤垃圾邮件。另外,Facebook可能会将其用于面部识别,并自动识别图像中的面部。我甚至可以在每部电影中呈现尼古拉斯·凯奇。

但是我们如何在GIS中使用它呢?

机器学习类型(ML)

机器学习的两大类是 被监督的无监督的 . 它们都可以以各种方式应用于GIS应用。首先,两者有什么区别?

监督学习 只是将数据拟合到一个函数中进行预测。例如,如果在一个图中绘制数百万个采样点,可以用一条线来近似一个函数。

无监督学习 识别使用未标记数据的模式的数据。例如,它需要数以百万计的图像,并通过训练算法运行它们。经过数万亿次的线性代数运算,它可以拍到一张新的照片,并将其分割成簇。

最重要的是,机器学习是关于优化解决问题的。所以它是自动的 自主学习从经验中改进 .

最近,GIS将人工智能应用于分类、预测和分割等领域。

图像分类(支持向量机)

当你看卫星图像时,并不总是很容易知道你是在看树还是草……或者道路还是建筑物。所以想象一下计算机知道这有多困难。

svm support vector machine

支持向量机(SVM)是一种机器学习技术,它获取分类数据并观察极值。接下来,它根据称为 “超平面” . “超平面”边缘向上推的数据点是 “支持向量” .

“支持向量”之所以重要,是因为它们是最接近对立类的数据点。因为这些点是唯一考虑的, 模型中可以忽略所有其他训练点 . 基本上,您可以向SVM提供树木和草地的训练样本。在此训练数据的基础上,建立了相应的决策边界模型。

现在,这个结果 supervised classification 不是很完美,算法还有很多东西要学。我们仍然需要对道路、湿地和建筑物等特征进行研究。随着算法得到更多的训练数据,它最终将改进到任何地方的分类。

经验贝叶斯克里金预测

你可能知道, kriging interpolation 根据空间模式预测未知值。它根据变异函数估计权重。估计曲面的质量反映在权重的质量上。更具体地说,您需要能够给出无偏预测和最小方差的权重。

kriging results

与适合整个数据集的一个完整模型的克里金不同,EBK克里金至少模拟了100个 local models by sub-setting the whole data set . 由于该模型可以局部变形以适应每个个体的半变异函数,因此克服了平稳性的挑战。

Empirical Bayesian Kriging (EBK) 它使用各种各样的模拟,反复预测多达100次。每一个半变差函数彼此都不相同。最后,它将所有半变差图混合为最终曲面。你不能像传统的克里格那样定制。

最后,它输出它认为是最佳解决方案的内容。就像蒙特卡洛分析一样,它在后台为您重复运行它。如果这是一个随机过程,你会让这个随机过程运行上千次。您可以看到结果数据中的趋势,并使用它来证明您的选择是正确的。这就是为什么 EBK几乎总是比直接克里金预测得更好。 .

基于k均值的图像分割与聚类

K均值算法是目前最流行的数据聚类方法之一。在k均值分割中,它将未标记的数据分组到 组数 代表 变量K .

obia segmentation clustering ml

这种无监督学习方法根据特征的相似性,迭代地将每个数据点分配到K组中的一个。例如,相似性可以基于光谱特征和位置。

在一个 unsupervised classification ,k均值算法首先对图像进行分割,以便进一步分析。接下来,为每个集群分配一个土地覆盖类。

然而,GIS可以以其他独特的方式使用集群。例如,数据点可能代表犯罪,您可能希望进行群集 热点和低点 犯罪。或者,您可能希望根据社会经济、健康或环境(如污染)特征进行细分。

大数据的深度学习与培训过程

无论你是在GIS或其他领域,机器学习都是这些天的热门话题。它是关于提取大数据集的。因为如果你能让电脑检测到这些功能,它会向你展示你从未注意到的东西。

neural network machine learning

因为有太多的数据,您可以从中发现固有的模式。最终的结果就是一个训练好的神经网络,它只有一组加权值。

当你训练大数据的时候,这是你需要所有你能得到的火力的时候。但是一旦你训练了模型,它只是一个文件中有一组权重的模型……这就是为什么机器学习是人工智能的一种形式——因为你可以训练你的数据,然后把它应用到全新的东西上,并预测它是什么。

总体而言,GIS使用机器学习进行预测、分类和聚类。AI和ML仍然是一个不断发展的领域,每天仍在开发许多框架。

阅读更多: Introduction to Machine Learning | Google’s Machine Learning Crash Course