English | 武汉大学 | 院长信箱
点击展开菜单

学术交流

学术前沿
当前位置: > 科学研究 > 学术交流 > 学术前沿 >

单杰:从专业遥感到大众遥感

时间:2018-02-08 来源:测绘学报 点击:

摘要:受智能手机日益普及、开放科学迅猛发展的影响,遥感正在由专业化发展和应用走向大众化发展和应用。这一趋势主要体现在数据采集的大众化、数据处理的大众化和数据使用的大众化。本文围绕这3个特点进行讨论和分析,介绍了国内外新近的一些代表性工作和进展,同时也列举了众多国际上的开放数据处理工具,包括摄影测量处理、激光扫描测量处理、影像机器学习、地理空间信息管理等。此外,本文还对开放数据的收益作了详细阐述,并列举了众多覆盖全球的数据计划和用于科研的试验用数据集。本文最后指出,遥感的大众化既会产生巨大的经济效益,也将产生巨大的社会效益,并最终改变行业的格局和大众的生活方式。

 

关键词:遥感测绘    地理信息    智能手机    开放数据    开放科学    

Remote Sensing:From Trained Professionals to General Public

SHAN Jie1,2     

 

Abstract: Influenced by the growing popularity of smart phones and the rapid development of open science, remote sensing is being developed and applied more by general public than by trained professionals. This trend is mainly embodied in the democratized data collection, democratized data processing and democratized data usage. This paper discusses and analyzes the three aforementioned characteristics, introduces some recent representative work and progress. It also lists numerous international open data processing tools, including photogrammetry processing, laser scanning processing, machine learning, and spatial information management. In addition, the article makes a detailed description of the benefits of open data, and lists a number of global data programs and experimental data sets for scientific research. At the end of this paper, it is pointed out that the democratization of remote sensing will not only produce great economic benefits, but also bring about great social benefits, and finally change the landscape of industry and the life style of people.

 

Key wordsremote sensing     geomatics     smart phones     open data     open science    

自19世纪出现摄影测量开始,专业遥感(如以测绘为目的的测绘遥感)已经有近200年的历史。在这一漫长的时期中,专业遥感通常都是作为一个专业或行业在发展、管理和使用。作为专业,有相对稳定的教育框架、课程体系和培养方案;作为行业,有相应的就业对口企事业部门,特别是在各级政府尤其是政府垂直管理的部门中有特定的管理部门、庞大的生产队伍。

长期以来,这些测绘遥感部门的常规工作是测绘地形图(含相应的数字产品)或生产与之相关的其他专题图、规划图等。一个明显的特点是,各部门都有自己的遥感专业人士、系统的数据采集手段和流程、标准化的产品和特定的产品使用范围,具有很强的专业性。具体体现在:数据生产和产品制作通常由测绘遥感专业人士根据一定的标准和流程完成,产品主要为地形图或其他各类专题图,服务对象以政府和军事机构为主,用于政府掌握和管理国家基础地理信息和国土海洋资源。此外,政府各部门根据其职能与职责积累了大量的数据和信息,而这些信息散落于众多的数据和信息拥有者,存在重复生产、集成度低、数据共享不足的问题。

然而,这一多年形成的状况近10年来正在悄然改变。随着互联网与网络通信技术的迅速发展、移动智能终端的快速普及,数字城市、智慧城市及以位置服务为代表的数字技术深入到大众的日常生活,由此导致当前和未来一个时期内测绘遥感发展的显著趋势和特点是由专业化走向大众化,具体体现为:① 数据采集的大众化;② 数据处理(工具)的大众化;③ 数据使用的大众化。在这些大众化的特点下,我们正迎来一个大众化(democratized)的、开放的遥感时代。以下就上述特点分别针对国内外在测绘遥感领域的一些典型进展进行介绍和讨论。

1 数据采集的大众化

数据采集大众化的一个显著标志是移动智能终端的使用和普及。同时,一些廉价的固定或移动平台,如无人机、便携式或穿戴式传感器等,也推动着数据采集向大众化迅猛发展。简单便携的分析设备正走进我们日常生活的各个方面,如个人保健、医疗分析、食品安全和环境监测等。智能手机作为最普及的移动设备在分析测试方面最具潜力,它带有越来越多的传感器:加速度计、麦克风、摄像头、陀螺仪、定位装置等,可以方便地获得各种数据和信息[1],如捕获人类行为数据、记录位置信息、感测环境变化,甚至可以为相关科学研究记录和分析数据,成为无所不在、人人拥有的大众传感器,成为人们生活中最受欢迎的电子设备。研究人员发现利用手机传感器进行感知是一个令人兴奋的方法,不能低估,在许多研究领域的数据收集和处理中都可发挥重要作用[2]。下面介绍近期报道的与测绘遥感相关的几个例子。

1.1 摄影测量

英国埃克塞特大学(University of Exeter)的研究人员开发了一个Android手机应用程序,可以将智能手机转换为独立的遥感设备,该程序使用智能手机中加速度计、GPS、指南针和摄像头等传感器,允许智能手机自主运行,可以利用从轻型高空作业平台(如无人驾驶飞机)或风筝上获取数据来进行景观绘制。这类系统成熟普及后,可以在全球范围内支持以大众为主要参与者的测绘活动,帮助灾区人道主义救援工作等。需要说明的是,这是一款开源软件,可以从欧洲非营利研究机构FoAm Kernow(https://fo.am/kernow/)免费下载。

文献[3]提出了一个“一日重建罗马”的系统(https://grail.cs.washington.edu/rome/),从海量网络照片集合中寻找影像,通过在互联网照片共享站点上搜索给定城市(如罗马)的照片,对其进行影像匹配实现城市场景的三维重建。该系统采用新颖的并行分布式匹配和重构算法,最大限度地提高处理流程中各个阶段的并行度,同时最大限度地减少序列化瓶颈。试验结果表明,在拥有500个计算核的计算机集群上,可在不到一天的时间内重建由15万张图像组成的城市。

文献[4]提出了一种实现从城市尺度三维重建到世界尺度三维重建转变的系统框架(http://www.cs.unc.edu/~jheinly/reconstructing_the_world.html),可以实现仅用一台电脑处理几千万张来自互联网的影像。该方法通过使用基于流模型的组件进行图像链接的检测进而实现高可扩展性,并且可在不牺牲重建后模型完整性的前提下,达到甚至超过其他大规模建模方法的效果,具有更高的效率和可扩展性。作者从Flickr网站中获取9600万张影像,并对其进行处理,共花费5.26天即获得世界尺度的三维重建结果。

文献[5]介绍了利用众源影像进行大众协作的在线城市三维重建,并在谷歌和苹果应用商店上线相关应用程序。该方法并没有对整个城市场景进行一次性重建,而是利用可获得的建筑物轮廓线(如OpenStreetMap)对城市进行分街区、增量式重建。该方法将利用运动恢复结构技术(structure from motion,SfM;相当于摄影测量中的光束法平差)获得的点云与建筑物轮廓进行配准,获得相应的地理参考,将分街区重建的结果统一在相对坐标系统下。该系统能够对用户新上传的影像进行快速反应,判断能否应用于场景重建,并且能够有效地处理恶意影像及GPS信息中的噪声[5]

文献[6]介绍了一种基于智能手机的海岸监测技术。首先进行相机检校,依靠嵌入在智能手机中的GPS提供的三维坐标,使用加速度计和磁力计计算的姿态参数的标准差在0.33°~2.04°范围内。然后,使用地面控制点对智能手机拍摄的图像进行三角测量,其精度达到0.681像素,而使用测量相机的中误差为0.404像素;对智能手机相机检校后,可以获得与测量相机相当的精度。最后,使用来自地面激光扫描获取的数字高程模型(DEM)计算海岸剖面及提取海岸线。这种基于智能手机的监测技术,具有成本低的优势,可以作为新的海岸监测手段广泛使用。

同一个研究小组也研究了智能手机作为摄影测量无人机有效载荷的可行性[7]。他们利用研发的系统分别在静态和动态条件下获取图像、位置和姿态数据,并对其进行三角测量,生成对应的正射影像用于精度评价。试验发现,在静态条件中,在考虑相机内参数时,对所有类型的智能手机获取的影像进行三角测量,中误差均小于1.28像素;与不考虑内参数的情况相比,提高至少47%。在动态条件中,即便考虑内参数,智能手机图像三角测量的精度也没有明显改善。这是因为受无人机的振动及速度的影响,智能手机的CMOS传感器中的电子快门的自动对焦技术可能对使用立体影像生成DEM产生负面影响。考虑到这仅仅是利用一个智能手机获得的结果,智能手机作为无人机有效载荷是可行的。

武汉大学的研究小组研究了利用智能手机拍摄建筑物的立面照片补充机载激光点云缺失的立面信息的可行性[8]。首先,利用多视影像立体匹配技术由手机照片生成建筑物立面的三维点云,然后将该立面三维点云与航空激光扫描直接获取的屋顶点云进行配准和融合,最终形成包含立面与屋顶的完整建筑物三维点云。该团队利用立面点云和屋顶点云在建筑物轮廓上的相似性进行配准,解决了这两种点云通常只有少量重叠导致的融合困难问题。

1.2 多光谱遥感

参与感知(participatory sensing)是一个与“大众遥感”类似的概念,意指非专业人员或外行人能够容易地使用标准的低成本移动设备收集地理数据。Max等提出基于参与感知的作物高度评估[9],19位参与者在德国海德堡的一个玉米田用智能手机和手持GPS设备测量作物高度,然后与地面激光扫描提供的参考数据相比较,发现作物高度模型的精度为10.45 cm(GPS装置)和14.69 cm(智能手机)。此外,他们认为,将参与者的认知能力纳入数据收集过程中可能会提高由参与感知方法捕获的数据质量;这些数据是现场采集农业参数的基础,与遥感等其他方法结合,可以开辟新的视角,支持农业发展。

一般认为,高成本限制了高光谱遥感技术在主流市场中的广泛应用,其中规模、可重复性和费用尤为重要。而日常智能手机的广泛使用为开发移动多光谱图像分析应用提供了有利的平台,可以提取感兴趣的特定信息,并且成本低、易标准化、容易在全球普及。

文献[10]展示了一种基于智能手机的快速检测光谱仪,通过探测各种苹果品种表皮中存在的叶绿素紫外荧光来分析水果成熟度,得到令人满意结果。并且该设备在智能手机上提供应用程序界面来通信、接收、绘制和分析光谱数据。Kim等探讨了基于智能手机的多光谱成像定量早期诊断和治疗皮肤病变的潜力[11]

在以色列特拉维夫大学创建的Unispectral公司(http://www.unispectral.com/),研究人员正在开发用于智能手机的小尺寸高光谱相机。通过照片捕获材料的独特电磁光谱信息,并结合独特的算法,实现包括农业、银行、医学、自动驾驶等多领域的广泛商业应用。

2017年4月,美国伽利略集团公司宣布推出基于ARMADATM智能手机的高光谱系统。该公司将机载光学、处理和分析功能的核心部件成功扩展到普通智能手机。该系统用于农业科学应用和研究,为作物表型(phenotype)、疾病检测和特征建模能力开辟道路,还可以提供关于作物健康的实时状态分析,进行必要的营养调整、杂草鉴定、除草剂应用等。ARMADATM收集的数据可以从现场发送到办公室、实验室或家用电脑,以便用户立即审查,对整体作物长势进行及时的响应。值得说明的是,这项技术适用于一般大型农场的农民,意义远远超出了工业化国家。

1.3 城市导航定位

由于城市建筑物的遮挡,全球导航卫星系统(GNSS)用户设备在城市尤其是在垂直于街道方向的定位效果很差。为了解决这一问题,伦敦大学的Wang等提出使用城市三维模型来预测卫星盲区,研究了一种称为阴影匹配的定位方法[12]。其开发的系统实现了在接收GPS和GLONASS的智能手机上的实时影像匹配。由于预先计算了建筑物边界的网格并存储在手机中,或根据需要从网络下载该网格中的数据,其一般处理时间仅为1~2 s。试验表明,使用这种预测定位方法,可将垂直于街道方向的定位误差从14.81 m降至3.33 m,定位精度提高约4倍。这项工作的意义在于,将城市三维模型与导航定位结合起来,是对传统基于地图匹配的导航定位方法的扩展,也是一种将数据生产流程反向使用的定位方法。在垂直于街道方向得到米级定位精度,有益于智能交通系统(ITS)、自动车道识别、为视障者和游客提供及时导航、基于位置的广告(LBA)服务等。

城市交通拥堵现象严重影响了车辆行驶,而传统导航系统并没有考虑实时交通状况,难以为使用者推荐最佳的行驶路线。印度学者Dhar等提出了一个大众共享交通信息的手机导航系统[13]。该系统旨在利用大量用户上传的GPS定位信息估计各个交通节点的拥堵情况,为使用者推荐最省时的行驶路线。利用该系统,他们比较了谷歌地图推荐的3条行驶路线,发现当考虑交通拥堵情况时,其中一条路线明显优于另外两条,其中,最短与最长行驶时间分别为613 s和1025 s。未来,他们的工作将聚焦于为不同使用者自动推荐不同路线,从而将交通拥堵情况控制在最低的限度。

1.4 灾害应急

美国伯克利大学的研究人员最近报道了利用手机以众筹方式来探测地震、实现预警的可能性。他们开发的MyShake智能手机应用程序使用加速度计和GPS测量发生的抖动,当有足够的用户使用该应用程序时,个人手机就成为地震仪[14]。当MyShake检测到类似于地震的抖动时,信息将发送到服务器,若有足够的手机检测到抖动,则可将该数据汇集在计算机中并进行分析。如果是大地震,警报可以从最接近地震震中的人的手机发送出来,让人们远离。研究人员估计,为了准确地检测到某个地点的大地震的起源和开始时间,在大约12 331 km2的地区,需要安装至少300台手机。在一个地区使用MyShake的手机越多,就能获得更准确的信息。需要特别指出,除了高精密的传感技术之外,这项技术也需要先进的模式识别和机器学习方法。为了使智能手机中的传感器正确区分日常振动(如跑步)和地震之间的差异,研究人员通过将一系列装有该应用程序的智能手机放置在模拟地震的实验台上,“训练”应用程序,以此来使手机正确识别地震信号。世界上大约有10亿部智能手机,因此,研究人员希望将这一技术扩展为地震监测甚至早期检测系统,在地震基础设施有限的地区,在大量手机的基础上建设新的地震网络。例如,尼泊尔2016年遭受了巨大的地震,造成8000多人死亡,类似的情况可能会受益于MyShake等早期预警系统。因为,尼泊尔只有几个地震台站,但有600万台智能手机。鉴于该大地震距离首都加德满都约80 km,研究人员估计,智能手机预警系统可以在震荡开始前20 s通知城市,为挽救生命赢得宝贵时间。

2 数据处理的大众化

除了上述数据获取的大众化之外,数据处理(方法和工具)也日益趋于大众化。许多个人和单位、专业人士和非专业人士开发的数据处理工具被大众免费使用。这种趋势与数据科学、开放科学(open science)的发展目标相吻合,很大程度上推动了测绘遥感在研发、教学、生产中全面和快速的发展,也促进了学科交叉融合的日益深入和广泛。

2.1 摄影测量处理

维基百科详尽地列出了摄影测量和计算机视觉方面的软件。为适用本文内容,我们对其中的开放软件部分作了少许编辑,并在此基础上补充了几个最近开放的软件,见表 1。完整的列表可参考https://en.wikipedia.org/wiki/Comparison_of_photogrammetry_software。从表 1可以看出,自2010年以来,开放的摄影测量和计算机视觉软件呈现了爆发式的增长,一定程度上反映了数据处理大众化的趋势。

表 1 开放摄影测量与计算机视觉软件(按时间排序,部分摘自wikipedia)Tab. 1 Open photogrammetry and computer vision software(sorted by inception date)

Name Platform Automatic modeling Scalability Type of photogrammetry Inception Vendor/creator
e-foto Linux Yes Multiple images Aerial, UAS 2002 Unknown
ARC3D Web-based Yes Multiple images Close-range 2005 KU Leuven
Micmac Linux, OS X, Microsoft Windows Semi-automatic Multiple images   2005 IGN
Photosynth Microsoft Windows No Multiple images Close-range 2008 Microsoft Live Labs, University of Washington
PHOTOMOD Lite Microsoft Windows Yes 40 images Aerial, Satellite, UAS 2009 Racurs
Ceres Solver Linux, OS X, Microsoft Windows   2010 Google Inc
Hypr3D(Cubify Capture) Web-based Yes Multiple images   2010 Viztu Technologies
My3DScanner Web-based Yes Multiple images Close-range 2010 My3DScanner
PHOV Web-based Yes Multiple images Close-range 2010 XLAB
StereoScan Unknown Yes 2 images   2010 Agisoft
123D Catch Android, iOS, Microsoft Windows, Web-based Yes Multiple images Close-range 2011 Autodesk
DroneMapper Web-based, Desktop Yes Multiple images Aerial, Oblique, UAS 2011 DroneMapper
Pix4Dmapper Discovery Microsoft Windows, Web-based Yes Multiple images Aerial, Close-range, UAS 2011 Pix4D SA
DataMapper Web Based Yes Multiple images UAS 2012 DataMapper
Mementify iOS Yes Multiple images   2012 Tretja dimenzija, XLAB
WebDLT Unknown No Multiple images Close-range 2012 B. Molnar, BME FMT
DroneDeploy Web Based Yes Multiple images UAS 2013 DroneDeploy
MVE Microsoft Windows, Linux, OS X Yes Multiple images Aerial, Close-range, UAS 2014 Technische Universit t Darmstadt
COLMAP Microsoft Windows, Linux, OS X Yes Multiple images Aerial, Close-range, UAS 2015 Johannes L. Sch nberger
Theia Microsoft Windows, Linux, OS X Yes Multiple images Aerial, Close-range, UAS 2015 Chris Sweeney
openMVG Linux, OS X, Microsoft Windows Yes Multiple images   2015 Pierre Moulon
openMVS Linux, OS X, Microsoft Windows Yes Multiple images   2015 CDC Seacave
Regard3D Linux, OS X, Microsoft Windows Yes Multiple images Close-range 2015 Roman Hiestand
VINS-Mobile OS X Yes   Cell Phone 2017 HKUST Aerial Robotics Group
OpenDroneMap Linux, OS X, Microsoft Windows Yes Multiple images UAS    
Python Photogrammetry Toolbox Linux, OS X, Microsoft Windows Yes Multiple images   Unknown Arc-Team
Metrology Engine Web-based No 2 images   Unknown VisualSize
VisualSFM Linux, OS X, Microsoft Windows Yes Multiple images Close-range Unknown Changchang Wu
Ames Stereo Pipeline Linux, OS X Yes Multiple images Satellite Unknown NASA


    需要说明的是,在这些开放的软件中,由传统摄影测量公司开发或发布的产品并不多,而由计算机公司、新兴的无人机公司、网络公司、土木工程和设计公司、社交媒体公司等开发产品居多。这里选择性地介绍几个有特色的软件工具。

(1) ARC3D(http://www.arc3d.be)是比利时Leuven大学开发研究的一个摄影测量软件和服务。除了像其他开放摄影测量软件一样,用户可以下载使用之外,还可以向其网站提交需要处理的影像,后台的计算机经过立体匹配等处理后将返回自动生成的三维点云。

(2) Ceres Solver是Google公司开发的一个非线性最小二乘问题求解工具包,可用于建模和解决大型复杂优化问题。它被用于Google公司产品多年,其功能强大丰富、计算高效稳定,自2010年以来受到Google公司持续的开发支持。Ceres Solver的应用非常广泛,表 1中COLMAP、Theia和openMVG都使用Ceres Solver进行平差解算。

(3) Colmap(https://colmap.github.io/index.html)是一个通用的SfM和多视立体(MVS)生产流程,具有图形和命令行界面。它提供了一系列摄影测量的功能,支持航空影像、倾斜多视影像和近景无序图像的重建。

(4) OpenDroneMap是一个用于处理无人机图像的开源工具包。它可以处理大众无人机获取的非量测相机影像,生成点云、数字表面模型、纹理数字表面模型、正射成像、分类点云、数字高程模型等。该软件可在http://opendronemap.org/https://github.com/OpenDroneMap/OpenDroneMap下载。

(5) Regard3D(http://www.regard3d.org)是一个由业余爱好者开发的摄影测量软件。其开发者Roman Hiestand是一家瑞士公司的软件工程师,专注于使用C/C++、多线程、计算机视觉、科学计算和信息安全进行多平台开发。他自称为一个业余的摄影测量爱好者,通过集成几个优秀的软件库和程序,开发了摄影测量软件Regard3D,目前已经发布了0.9.1版本。Regard3D使用从不同角度拍摄的照片创建3D模型,为此完成了一系列摄影测量工作,包括:特征点检测(如角点、边缘等)、特征描述、特征匹配、确定相机的三维位置和姿态、稀疏点云生成、密集点云或表面生成。Regard3D完全免费使用,由Regard3D创建的所有工作也可以自由使用。

(6) VINS-Mobile(https://github.com/HKUST-Aerial-Robotics/VINS-Mobile)是由香港科技大学航空机器人研究小组成员开发的实时单目视觉辅助的惯性状态估计器。它在iOS设备上运行,并为增强现实(augmented reality)应用程序提供本地化服务。VINS-Mobile使用基于滑动窗口优化的构想,提供高精度的视觉惯性测距,具备自动初始化和故障恢复功能,并使用全局姿态图SLAM实时校正积累的测距误差。

值得注意的是,以上开放软件中,有一些软件可以完成从影像到纹理模型的整个处理过程,而其他软件则只完成其中的一个或几个中间流程,如SfM、密集点云匹配和三维三角网构建等。为此,英国利物浦约翰摩尔斯大学(Liverpool John Moores University)的Peter Falkingham博士专门对这些开放软件进行了测试(https://pfalkingham.wordpress.com/2016/09/14/trying-all-the-free-photogrammetry/),试图通过组合多个开放软件,以完成从影像到模型的整个摄影处理处理流程。具体如图 1所示,如果把从影像到模型的整个处理流水线分为SfM、密集点云匹配、三维三角网构建和后处理(主要是纹理贴图)4个工序,那么每个软件可以或多或少地与其他1~3个软件相结合,完成整个处理流程。图中红色箭头衔接的工序之间工作得很好,绿色箭头衔接的工序存在问题,蓝色的还没有进行尝试。从图中可以看出,商业软件PhotoScan可以完成整个处理流程,开放软件MVE也可以完成整个处理流程,其他软件则需要进行工序上的组合从而完成整个处理流程,如OpenMVG+OpenMVS组合、VirsualSFM+PMVS+MeshLab组合等。

图 1 开放摄影测量软件流程组合测试(https://pfalkingham.wordpress.com/2016/09/14/trying-all-the-free-photogrammetry/)Fig. 1 Test on the workflows of open photogrammetry software

2.2 激光扫描测量处理

激光扫描测量数据需要高效的软件平台进行展示、处理和分析。目前已有很多开放的激光扫描测量数据处理软件,以下是一些典型代表。

(1) Quick Terrain Reader(https://www.idaholidar.org/tools/bcal-lidar-tools/)快速地形阅读器是Quick Terrain Modeler的免费配套软件。可以打开DEM和点云,并允许用户以快速和直观的方式自由漫游地形。

(2) BCAL LiDAR(https://bcal.boisestate.edu/tools/lidar)是由爱达荷州立大学博伊西中心航空实验室(BCAL)开发的开源工具,可用于处理、分析和可视化LiDAR数据。它由IDL编程语言编写,旨在用作ENVI遥感软件包中的附件。

(3) FugroViewer(http://www.fugroviewer.com/)是一款功能强大,易于使用的免费软件,可以用于栅格和矢量数据,如摄影测量、LiDAR和IFSAR的数据,支持美国摄影测量和遥感学会(ASPRS)定义的用于激光雷达数据存储和交换的开放文件格式的最新版本LAS1.4。

(4) MARSFreeView(http://www.merrick.com)支持基本的LiDAR数据导航和浏览,免费使用。

(5) Points2Grid(https://github.com/OpenTopography/points2grid)是一个强大、可扩展的用于由激光雷达点云生成DEM的工具,是OpenTopography点云处理系统默认的DEM生成算法,已通过数千个DEM生成作业的测试。

(6) LAStools(https://github.com/LAStools/LAStools)是一款强大的机载LiDAR处理软件套件,可方便地用于LiDAR数据的分类、滤波、栅格化、等高线生成、三角化和多边形化等。

(7) CloudCompare(https://github.com/cloudcompare/cloudcompare)是一个开源的3D点云和网格处理软件。它提供了大量手工编辑、渲染三维点云和三角网的基础工具,并允许用户在上面集成自己的插件。

2.3 影像机器学习

(1) ImageNet(http://www.image-net.org/)是目前图像识别领域最大的数据库,由美国斯坦福计算机科学家模拟人类的识别系统建立。整个数据库根据WordNet层次结构组织,拥有多个节点(Node),平均每个节点包含超过500张的训练图像。

(2) KITTI数据集(http://www.cvlibs.net/datasets/kitti/)是由卡尔斯鲁厄理工学院与芝加哥丰田技术研究所联合发布的自动驾驶数据集,用于立体匹配、光流、视觉计程(visual odometry)、三维物体检测和三维跟踪。其中包括由一对立体相机采集的高分辨率彩色和灰度视频影像,以及由Velodyne激光扫描仪和GPS定位系统采集的三维路面实况,数据遍及卡尔斯鲁厄城的农村和高速公路区域。

(3) NYU Depth Dataset V2(http://cs.nyu.edu/~silberman/datasets/nyu_depth_v2.html)是由纽约大学发布的深度影像数据集,包含3个城市的464个场景,1449对经过配准和标记的彩色与深度影像,以及407 024个未标记的影像帧,被广泛用于室内三维场景理解的研究。

(4) Thepascal voc数据集(http://host.robots.ox.ac.uk/pascal/VOC/)由利兹大学、鲁汶大学、爱丁堡大学、牛津大学和微软剑桥研究院联合提供。它提供了用于目标检测的标准化图像影像集,以及用于访问数据集的通用工具。该数据集能对不同的方法进行评估和比较,同时能够对目标的识别性能进行评估。

(5) Middlebury数据集(http://vision.middlebury.edu/stereo/data/scenes2014/)是由米德尔伯里学院提供的立体匹配数据集,数据包含亚像素级精度的真值,广泛用于立体匹配算法的性能测试和评估。

(6) COCO(http://mscoco.org/)是微软团队获取的一个用于图像识别、分割和字幕生成的大型数据集。它以场景理解为目标,从复杂的日常场景中截取,通过分割实现目标的精确标定。数据集中图像包括91类目标,328 000张影像和2 500 000个标签。

(7) Cityscapes数据集(https://www.cityscapes-dataset.com/)包含来自50个不同城市街景场景中录制的多种立体视频序列,用于像素级和实例级语义标记性能评价。

(8) MPI Sintel数据集(http://ps.is.tue.mpg.de/research_projects/mpi-sintel-flow)解决了现有光流基准测试的局限性,包含流场、运动边界、不匹配区域和图像序列。它旨在促进长距离运动、运动模糊、多帧分析和非刚性运动的研究。

(9) SUN3D(http://sun3d.cs.princeton.edu/)是普林斯顿大学提供的大规模RGB-D视频数据集,数据集包括多个完整的室内场景以及对应的摄像机参数和物体标签,可用于场景理解和三维重建研究。

(10) ShapeNet(https://www.shapenet.org/)是由普林斯顿大学、斯坦福大学和TTIC的研究人员联合提供的大型3D形状数据集。它涵盖55个常见对象类别,大约51 300个独特的3D模型。该数据集为世界各地研究人员提供数据,以便能够在计算机图形学、计算机视觉、机器学习和其他相关领域进行研究。

(11) YouTube-8M(https://research.google.com/youtube8m/index.html)是一个大规模视频标注数据集,包含上百万个YouTube视频链接及对应标签。它旨在推动大规模视频理解、特征学习、噪声数据建模、迁移学习和域自适应方法的研究。

(12) HandNet数据集(http://www.cs.technion.ac.il/~twerd/HandNet/)包含RealSense RGB-D相机记录的10个工作人员的手部非刚性变形深度图像,包含以手和五指为中心的6D姿态信息。

(13) MegaFace(http://megaface.cs.washington.edu/)是华盛顿大学收集的一百万张人脸图片,代表 690000个独特的人。MegaFace是第一个百万规模级别的面部识别算法测试基准。

2.4 地理空间信息管理

多源、多类、多时相的遥感和地理数据需要一个统一的数据平台进行管理和分析。目前已有很多开放的地理信息平台,以下是一些典型的代表。

(1) GDAL是一个用于读写各种栅格和矢量数据的开放软件库。此外,它还支持一定的投影和转换。GDAL开始时主要由Frank Warmerdam开发,后来其维护移交到开源地理空间基金会下的GDAL/OGR项目管理委员会,成为一个主要的开放软件项目。

(2) QGIS是一个跨平台的免费和开源地理信息系统。它除了汇总和导出地图之外,还允许用户分析和编辑空间信息,支持多种格式的栅格图像并实现地理配准。此外,QGIS还支持个人地理数据库、DXF、MapInfo、PostGIS等格式,允许通过Web服务使用外部来源的数据。

(3) SAGA GIS是一种用于编辑空间数据的免费和开源地理信息系统。它起初由德国哥廷根大学自然地理系开发,目前已由一个国际开发社区来维护和扩展。SAGA GIS旨在为科学家提供一个有效学习和实现各种地球科学原理和方法的平台,目前,已有越来越多的库建成并可供使用。

(4) GRASS GIS于1982年由美国陆军施工工程研究室(USA-CERL)研发,1985年发布第一个版本。1990年,CERL停止对GRASS的官方支持,随后GRASS开始走下坡路。1999年,GRASS实行开源,由此GRASS开发和应用形成一大批活跃的开发社区。2006年,GRASS项目组加入开源地理空间基金会,自此成为开源地理基金会的正式项目。目前,GRASS的最新版本为7.2.1,可以运行在Mac OSX、Windows及Linux 3个平台上,具有良好的平台移植性和拓展性。GRASS可用于空间数据管理和分析、图像处理、地图制图、空间建模和可视化等方面,在全球学术界、工业界及有关政府机构中得到了广泛应用。

(5) OSSIM是一个用于遥感、图像处理、地理信息系统、摄影测量方面的开源软件。它主要使用C++编写完成,支持Linux、Windows、Mac OSX及Solaris等多种平台。由于OSSIM使用了模型-控制器-视图的结构,所以算法的实现和图形化界面(GUI)是分离的,这使得OSSIM可以支持多种GUI接口。

(6) SharpMap是基于.Net平台,用C#语言开发的GIS开源项目,是一套简单易用的小型GIS平台。SharpMap与系统庞大、成本过高的商用WebGIS产品相比,具有小巧、开源、灵活的特点,适合小规模GIS软件的二次开发。它体积虽小,却实现了一个GIS软件的所有基本功能,支持多种GIS数据格式、支持空间查询;使用简单,只要在.Net项目中引入相应的动态链接库(DLL)即可,没有复杂的安装过程;拓展性强,可以用于开发网络和桌面GIS应用程序。

(7) World Wind是一款由NASA开发的开源三维地理信息系统,它既可以作为独立的单机GIS应用程序从互联网上访问空间信息数据,也可以作为其他应用程序的插件。World Wind可以将Landsat 7、SRTM、MODIS等多颗卫星的数据及其他网络地图服务(web map service,WMS)服务提供商提供的图像通过一个三维的地球模型展现。World Wind功能强大、可拓展性强、全部代码开源,以其为平台开发特定功能的GIS应用程序比较方便。

(8) MapWindow GIS是一款以MPL(Mozilla Public License, Mozilla公共许可证)为授权协议,基于.Net环境开发的开源地理信息系统和应用程序编程接口,使用它可以浏览和编辑多种GIS数据格式。不仅如此,MapWindow并不仅仅局限于提供纯粹的基本功能,其最大优势在于还提供了一个充分可拓展的插件接口,使用户自己可以对MapWindow的功能进行组合、增减,并且可以通过插件将各种与地理信息系统有一定依存关系的计算、模拟程序与MapWindow无缝整合,从而满足用户自己的特殊需求。美国环保署(EPA)已经采用它作为其BASINS(Better Assessment Science Integrating Point and Nonpoint Sources)流域分析和建模软件的主要平台。

(9) GeoTools是一个纯Java语言实现的开源GIS中间件,该项目隶属于开源地理空间基金会。GeoTools类库遵循OGC(Open Geospatial Consortium)标准规范开发,提供了从数据访问层到数据渲染层的GIS操作的实现,并定义了一系列标准的接口对外提供调用。GeoTools可用来构建不同种类的GIS系统,包括网络GIS应用服务器、桌面应用客户端等,是开源GIS产品中较为优秀的代表。GeoTools支持多种GIS数据源的访问,具体包括:矢量文件、栅格文件、关系型数据库、OGC规范下WMS地图图片服务、OGC规范下WFS矢量要素服务等。

(10) uDig是Refractions Research公司开发的一款用于浏览和编辑地理信息的开源桌面GIS系统,用于显示和编辑地理数据。它遵循OGC标准,适用于WMS、网络要素服务(WFS)等网络应用。uDig为用户提供了熟悉的操作环境,可以在Windows、Mac OSX和Linux这三大平台上运行,支持网络服务标准和主流产品,并为复杂的分析功能提供了一套框架。对于开发人员而言,uDig还提供了一套开源的通用Java GIS开发平台,开发人员可以基于uDig开发GIS应用程序,从而实现对uDig的扩展。

需要说明的是,除了上述基于本机的地理信息系统外,尚有许多基于网络的地理信息系统,如谷歌地球、谷歌地图、ArcGIS Online、天地图等为大众提供的地理信息服务平台。

3 数据使用的大众化

数据使用的大众化是指政府和非营利组织将他们收集或获取到的地理空间数据向大众开放,以用于不同科学目的或社会性项目。

首先要说明一个问题,为什么要开放数据,开放数据有什么好处?对此Open Data Institute(ODI)(https://theodi.org/the-value-of-open-data)进行了大量的研究和报道。据横向经济学(Lateral Economics)(https://lateraleconomics.com.au)的研究,开放数据可以比付费数据多创造了0.5%的国内生产总值(GDP)。2013年,麦肯锡(McKinsey)曾预计,各个行业的开放数据将为全球市场提供动力,每年将使其增加3万亿至5万亿美元。根据Capgemini在欧洲数据门户网站上的研究报告,到2020年,使用开放数据将使欧盟的公共管理成本降低17亿欧元。此外,开放数据的有效利用可节省6.29亿小时不必要的等候时间,进而减少16%的能源消耗。开放数据研究所的研究还表明,使用、生产或投资开放数据的英国公司雇用了50多万人,年营业额超过920亿英镑;美国Landsat数据每年可节省3.5亿至4.36亿美元。

世界银行集团(World Bank Group)的研究表明,世界各国政府正在将他们在许多地区收集的数据作为一种新型的公众资源向社会开放[15]。开放数据是在线免费提供的数据,任何人可以将其用于商业用途以外的任何目的和重新发布。虽然社会媒体、公司和非政府组织都可以作为开放数据的来源,然而最广泛的来源仍然是政府和政府支持的机构。他们发现,这种开放的政府数据可以用来创造社会和经济价值、确定社会和经济趋势、改进公共服务、建立政府信任、促进经济增长。世行开发了帮助世界各国政府评估和建立开放数据计划的方法,开放数据的业务价值可能会达到每年数万亿美元。开放数据的主要优点在于:开放数据可以帮助发起新业务、优化现有的业务,促进经济增长、创造就业机会,改善外商投资气氛;它也可以使就业市场更加高效,促进关键技术工作培训。

3.1 美国Landsat影像

时间早、规模大、影响广的数据大众共享是美国政府决定自2008年12月起将Landsat全球数据全部共享,向所有用户免费提供。Landsat是世界上收集时间最长的中等分辨率土地遥感数据,40多年来为农业、地质、林业、区域规划、教育、测绘和全球变化研究提供了重要资源。

截至2017年3月31日,全球用户已下载超过5600万景影像(https://landsat.usgs.gov/total-landsat-distribution)。约73%的用户是国际用户,其余来自美国;其中2008年以来新用户占43%,大多数用户是最终用户;超过一半的用户在学术界工作。就环境和社会效益而言,80%以上的用户看到了环境效益,如实现长期规划或监测、保护与改善环境条件、维护改善生态系统服务等。约90%的用户通过使用Landsat图像能够更好地交流并进行决策,75%的人用来支持执行法规或政策,减少人身危险,增加人的安全;近70%的用户用来解决纠纷减少冲突[16]

就经济效益而言,科罗拉多州立大学和美国地质调查局2015年的研究表明,2011年免费下载的238万景Landsat影像,使美国经济受益达到18亿美元[17],几乎是Landsat 8建设和发射成本的2倍。这个估计被认为是保守的,因为它没有考虑到Landsat数据的任何下游用户,即那些没有直接从USGS下载Landsat数据的用户。研究认为,Landsat的大部分价值来自于免费和开放的数据政策,为用户提供了大量的无成本数据,而即使少量的数据收费也将大大减少用户的数量。

欧共体也在考虑类似的卫星数据开放政策(https://theodi.org/the-value-of-open-data)。2012年欧空局的研究表明,政府的卫星数据开放政策在中长期内是有益的,到2030年,估计有300亿欧元的市场和数以万计的新工作。欧盟委员会计划公开所有公共数据——地理、统计、气象和公共资助的研究数据等。他们的目标是使纳税人低成本或零成本访问和重新使用收集的数据。修改数据政策以使欧洲公共部门机构可用的成本较低的数据使用量增加10~100倍。开放数据可以激发新的数据用途、吸引新的数据用户、创造新的工作机会。

3.2 全球数字地面模型(DEM)

最早的全球数字地面模型是1996年由美国USGS发布的GTOPO30,其分辨率较低(约1000 m),由8类不同来源的数据融合而成,高程精度优于30 m。类似于GTOPO30, 由美国USGS发布的GMTED2010也是多种数据融合而成,包括约1000 m、500 m和250 m 3个分辨率,精度相对于GTOPO30有一些提升。随着数据获取与处理技术的发展,全球DEM的精度也越来越高。目前中等分辨率(30~90 m)开放的全球DEM主要有3个来源:一是美国航空航天局于2000年2月用航天飞机干涉合成孔径雷达(InSAR)技术生成30 m分辨率的数字高程模型(SRTM DEM)。从2014年底开始,30 m分辨率的SRTM DEM数据已向全球逐步公开发布,目前已经覆盖包括中国在内的世界绝大部分地区,其高程精度优于16 m[18]。事实上,德国宇航中心利用SRTM X波段数据生产的DEM比美国利用SRTM C波段数据生产的DEM精度更高,但其呈网状覆盖全球(即有较多的数据缺失)的特点极大地限制了其应用。二是美国与日本联合推出的基于摄影测量的产品ASTER Global DEM(分辨率为30 m),覆盖面更广(占地球陆地面积的99%),但在有云遮挡的地区存在漏洞。2011年10月,ASTER Global DEM版本2公开发布,在版本1上大大改善, 被认为是崎岖山区比SRTM高程模型更准确的表示。三是ALOS World 3D,是由日本宇宙航空研究开发机构(JAXA)通过摄影测量方法生产的全球30 m空间分辨率数字表面模型,这一数据原始分辨率为5 m,其标称高程精度为5 m,经过采样后生成的30 m的DEM最近也已经向公众免费提供。

3.3 美国USGS 3-D Elevation Program

美国地质调查局(USGS)自2012年开始实施3D高程计划(3DEP)[19],以应对日益增长的对高质量地形数据及数字三维自然和人工地物的需求。3DEP的主要技术手段是采用激光雷达数据测量,计划8年完成。需要说明的是,3DEP计划实施前曾调查了34个联邦机构、所有50个州、一些地方政府和区域性办事处以及私营和非营利组织等的600多个业务用途。调查表明,全面资助和实施3DEP将为政府机构、私营部门和公民提供每年6.9亿美元的新效益。目前,所有公共机构每年投入大约5000万美元用于高程数据获取,但仅仅约有14%的州拥有满足所需质量水平的激光雷达数据。因此,每年需要额外的9600万美元来实施3DEP。但是,这项投资将导致近1:5的回报率。普遍认为,这个计划将为美国提供全覆盖的1~3 m分辨率的数字高程模型,并且向大众免费开放。

3.4 美国USGS土地覆盖数据

美国国家土地覆盖数据库(NLCD)[20]是美国用Landsat图像生产的30 m分辨率的土地覆盖数据库。NLCD提供了地表特征的空间参考和描述性数据,如专题类(如城市,农业和森林)、不透水百分比及树冠覆盖率等。NLCD支持各种联邦、州、地方和非政府应用,旨在评估生态系统状态和健康,了解生物多样性的空间格局,预测气候变化的影响,并制定土地管理政策。NLCD产品由多分辨率土地特征(MRLC)联盟创建,该联盟是由美国地质调查局牵头的联邦机构的合作伙伴。所有NLCD数据产品均可从MRLC网站(http://www.mrlc.gov)免费下载。美国土地覆盖数据有16类,自2001年开始,每5年更新和发布一次,目前的时间节点是2001、2006、2011、2016(待发布)。

3.5 全球土地覆盖数据集

全球土地覆盖数据(30-meter Global Land Cover Dataset)[21]由中国国家基础地理信息中心在2014年发布,是863计划“全球地表覆盖遥感制图与关键技术研究”重点科研项目的产品之一,该项目由国家基础地理信息中心牵头,来自国家测绘地理信息局、中科院、教育部、农业部、林业局等7个部门的18家单位共同参与。这一数据集的分辨率为30 m,由以2010年为基准年的Landsat卫星观测数据分类得到,将土地划分为耕地、森林、草地、灌木丛、湿地、水体、冻原、人工地物表面、裸地、永久雪地和冰地共10类,总体分类精度达到83.51%。

3.6 世界城市数据库

世界城市数据库(World Urban Database,http://www.wudapt.org/)的目的是通过众筹建立一个开放、共享的城市数据库[22]。城市化对城市、区域和全球范围气候的影响是一个颇有争议的话题。但是,目前大部分相关研究集中在使用人口和行政信息结合遥感数据来绘制城市地图,然而,这些数据难以提供关于城市内部组成的信息,这对于了解其对环境的影响及它们对变化的脆弱性至关重要。世界城市数据库在门户网站中提供基本工具,以便研究人员将本地数据汇总到指定的参考网格。该数据库以本地气候区(LCZ)作为分类框架,使用Geo-Wiki对不透水表面(如建筑物、道路、其他)、透水表面,草地等的土地覆盖和土地利用类型进行采样;采用在线和基于移动的工具以获得建筑材料、建筑尺寸、冠层宽度等其他信息。由于数据集的开放性,世界各地的研究人员可以将数据用于许多不同类型的应用,从气候和天气模型到能量平衡研究。第一届WUDAPT研讨会在都柏林大学(2014年7月7—9日)举行,其中16个城市参加为LCZ,会议讨论了数据收集协议,并期望有更多的城市专家和研究人员加入到这一计划中。

3.7 面向研究的开放数据

这些数据一般是或者含有地理真值,或者带有原始的观测数据、抑或没有经过过多的处理,覆盖范围较小,或有多种数据的覆盖,因此多用于科学研究。这里选择性地列出作者熟悉的一些参考数据供读者参考。

建筑物立面地面激光扫描数据集(http://www.ikg.uni-hannover.de/)。由Institute of Cartography and Geoinformatics at the Leibniz University of Hannover提供。

两个老建筑物的地面激光扫描数据(http://www.ifp.uni-stuttgart.de/publications/software/laser_splatting/index.html)。由Institute for Photogrammetry, University of Stuttgart, Germany提供。

NASA Scanning Lidar Imager of Canopies by Echo Recovery(SLICER)激光波形数据:https://denali.gsfc.nasa.gov/research/laser/slicer/slicer.html。

ISPRS点云滤波数据集(http://www.itc.nl/isprswgIII-3/filtertest/DownloadSites.htm)。目的是评价现有点云滤波的各种算法,共有8个数据样区的数据。

土地利用数据集(http://vision.ucmerced.edu/datasets/landuse.html)。由加州大学Merced分校提供。这是一个用于研究目的的21类土地利用图像数据集,每类有100张图片,每个图片256×256像素,像素分辨率为1 ft(1 ft=0.30 m)。其从USGS城市地图集中手工提取。

普渡大学高光谱影像数据集(含类别标注):https://engineering.purdue.edu/~biehl/MultiSpec/hyperspectral.html。

ISPRS城市分类、建筑物三维重建和语义标注数据集:http://www2.isprs.org/commissions/comm3/wg4/detection-and-reconstruction.html。

ISPRS各类影像数据集(http://www.isprs.org/data/)。其中包括近景、航空和卫星影像,如IKONOS和ZY-3。

EuroSDR航空影像密集匹配数据(http://www.ifp.uni-stuttgart.de/ISPRS-EuroSDR/ImageMatching/index.en.html)。鉴于自动影像匹配软件的不断发展,该测试数据集旨在评估摄影测量三维数据采集的潜力。试验数据包括两组垂直摄影和一组倾斜摄影。倾斜数据的覆盖区域是瑞士苏黎世,地面分辨率为6~13 cm,垂直影像的覆盖区域分别是德国Vaihingen(地面分辨率为20 cm)和慕尼黑(地面分辨率为10 cm)。

IEEE-GRSS每年都组织数据融合竞赛(Data Fusion Contest)。为此,他们也和其他单位公开发布一些独特的竞赛数据集。以正在进行的2017年竞赛为例,其实验数据由前述世界城市数据库组织(WUDAPT,http://www.wudapt.org)提供。其目标是促进多源遥感数据融合和分析方法的进展。2017年数据融合大赛的任务是在各种城市地方气候区环境中进行土地利用分类,并且评价所研究的方法在世界各地泛化的能力。竞赛数据除了多时相、多模态的影像数据外,还包括其他辅助数据,如具有土地利用信息的开放街道地图(OSM)。

4 结束语

遥感由专业遥感(含测绘遥感)向大众遥感过渡是一种必然,其内在驱动力是多方面的。首先,小型、多功能、廉价、轻便传感器的出现与普及,尤其是智能手机的日益普及和网络传输带宽的增强,智能手机已经被用作一种无所不在、随时随地由大众个人来获取数据的有效手段。实际上,动态数据的获取在很大程度上取决于使用机动、功能齐全的传感器,而智能手机恰好满足了这种特性,因此,大众使用的智能手机使得大众遥感无处不在的数据采集成为可能。

其次,城镇化、日益突出的环境、资源和气候问题,以及时常发生的恶性突发事件,使得在大尺度上来认识和监测我们居住的地球成为需要。日臻成熟的航空航天及地面遥感技术为满足这种需要提供了可能,而随着信息化向各行各业的融入,社会对各种基础地理空间数据的需求也越来越迫切,这必将推进测绘行业的跨行业服务和发展,促进数据、信息和资源的共享,使其在国家发展和人民生活中起到越来越重要的作用。

最后,遥感数据和处理工具与平台的开放化可以带动经济发展、产生新的就业机会,逐步成为数据科学和开放科学新的经济增长点。数据和处理工具的开放一方面为研究人员提供了更好的研究环境,极大地促进了学科交叉融合发展,为科学技术、领域应用甚至产业结构和服务方式提供了新的可能;另一方面,数据和工具的开放,打开了各部门各学科研究与应用的壁垒,减少了资源浪费,降低了地域间、行业间、学科间等的信息不对称,极大地促进科学技术的跨越式创新和普及。

总之,遥感正在从多个维度以前所未有的速度由专业走向大众。如果说,Landsat卫星数据的开放开启了遥感大规模的行业应用、产生了巨大的经济效益;那么,以智能手机为代表的大众传感器和大众科学正在使遥感从行业应用走向大众应用,在产生巨大的经济效益的同时,也终将产生巨大的社会效益。在这种大趋势下,一方面遥感科学的外延在不断扩大,正在改变行业的格局和大众的生活方式;另一方面,相关学科对遥感科学的贡献和影响也在与日俱增并不断注入新的思想和方法。所有这些都对遥感科学本身的发展与进步提出了新的挑战,时代正在给我们测绘遥感一个跨越式、全方位发展的机遇。


【引文格式】单杰。从专业遥感到大众遥感[J]. 测绘学报,2017,46(10):1434-1446. DOI: 10.11947/j.AGCS.2017.20170361