近年来,虽然利用多层人工神经元网络对非结构化数据进行学习的所谓“深度学习”方法(即机器学习技术)在研究中得到了广泛的应用,但如果没有专业知识,它在GIS中的集成并不总是那么容易。然而,正在开发的新工具可能会使更广泛的研究领域更好地利用机器学习和深度学习。到目前为止,已经出现了两个明确的前沿领先产品。
利用ArcGIS进行深度学习
近年来,ArcGIS花了大量时间开发更好的深度学习工具。他们使用了各种已经开发的用于图像分析的平台,例如Keras和Tensorflow,这都是非常流行的深度学习平台,并将它们与ArcGIS Pro(如ArcGIS Image Server等)工具集成在一起。大部分工作集中在图像分类上。ArcGIS已经构建了一些可以应用的模块,比如规范化的建筑物轮廓,这样可以快速绘制建筑地图。这些工具允许用户基于深度学习驱动的分类功能,并自动的在构建环境中绘制地图特征。尽管如此,仍有些项目需要人工统计图像中的个体数量,以此来估计人群规模和其他景观特征。
一些有趣的应用包括了在给定的城市环境中自动检测和计数游泳池。如果房屋被废弃,游泳池可能成为携带疾病昆虫的滋生繁殖地。游泳池的估计可用于评估特定区域的潜在疾病可能性[1]。其他应用则侧重于更广泛的图像分割和分类。语义分割(semantic segmentation)对图像中的像素进行分类,也是该软件包的一部分,用户可以使用python接口来塑造或创建自己的深度学习技术和制图方式。尽管如此,大部分的努力仍都集中在计算机视觉技术上,这种技术允许用户对图像进行分析和分类,特别是对航空图像[2]。
图1:ArcGIS Pro工具,用于标记和导出用于深度学习的训练数据。(图片来源:JHA & SINGH, 2018.)
开源深度学习工具与QGIS的集成
一个流行的开源工具名为Orfeo,它是一个分析高分辨率光学、多光谱和雷达图像的工具,最高可达TB(太字节)级。该项目最初是由法国航天局(CNES)开发的,但后来以开放源代码的形式吸纳了许多开发人员。该工具可以与QGIS等流行的GIS应用程序一起使用和调用,这使得它成为对编程经验要求相对较少的深度学习开发人员的较好的开放源码选项之一。再次强调,尽管可以通过修改其技术来分析其他形式的数据,但该开源工具的重点是图像。该工具还与Monteverdi密切相关,它将Orfeo的深度学习方法可视化。Monterverdi可以用于可视化深度学习的结果输出,例如遥感数据中的特征分类。该工具还有一个QGIS接口,可以直接与这个流行的开放源码选项集成[3] 。
图2:使用QGIS中的Orfeo工具箱进行深度学习。(图片来源:GEOFRANKER)
GIS的深度学习工具
其他支持开源项目的工具包括GRASS和R统计包,这两种工具不仅允许一般的和不同形式的空间分析,而且它们还促进了不同的工具集成[4]。然而,开源领域的Orfeo,和ArcGIS Pro的AI工具等,由于部署了可伸缩的体系结构,使得它们能够利用云计算处理大型图像数据,因此获得了更大的吸引力。虽然许多工具都可以潜在地集成到GIS工具中,特别是开源工具,但其局限性往往在于可伸缩性,研究人员还需要利用强大的GPU处理器或大型计算集群,而这些并不总是可用的。
虽然Esri和开源工具(如Orfeo)越来越多地让用户更直观地了解深度学习,但其应用领域仍然相对有限。特别是将自然语言等文本数据与图像以及其他空间数据进行整合,在很大程度上还没有得到应用。此外,人们还认识到物联网(IoT)将意味着越来越多的多传感器数据将需要集成到分析平台,如ArcGIS Pro中。这可能是GIS和开源工具的下一个巨大挑战。