点上方蓝字“测绘科学”关注

摘 要

针对传统空间查询无法满足地理数据交互式可视化对处理时间要求的问题,以窗口查询为例,提出了一种空间近似查询处理方法。该方法包括预处理和查询两步:在预处理阶段,利用分布化的线简化算法对空间对象进行顾及误差的预处理采样,将采样过程及误差值用树型结构保存;在查询阶段,以豪斯多夫距离定义数据可视化的误差,进行误差可知的顶点即时采样与截取,从而实现针对可视化应用的高效的空间近似查询处理。在Hadoop集群上利用77GB 的OpenStreetMap数据集进行了实验,证实了本方法的效力与效率。

引用格式

引用格式:仇阿根,刘纪平,张志然,等.地理要素的分布式空间近似查询处理方法[J].测绘科学,2017,42 (7):57-64.

正文

地理空间大数据的发展,对地理数据交互可视化提出迫切需求, 传统方法难以满足。例如,全球尺度高精细地理要素数据集OpenStreetMap的采集、编辑、应用已形成基于互联网的完整体系,但交互式可视化的实现却较为困难。原因在于空间查询计算量大和查询结果集大, 导致处理时间长, 传输、渲染慢。当前, 数据库领域学者采用在线聚合、采样计算等近似查询方法解决查询计算量大的问题; 分布式计算也被用于解决空间查询计算量大的问题;空间数据库与数据可视化领域学者采用后端数据库查询的同时进行数据简化为主的方案, 如数据过滤和采样、模型化简法、分箱法、混合方法等,以解决查询结果集大的问题。上述研究解决非空间数据的交互式可视化问题, 但空间对象采样需要保持几何、拓扑特征, 其无法直接应用于地理空间大数据交互式可视化。

本文提出基于分布式环境的空间近似查询处理方法, 以豪斯多夫距离定义数据可视化的误差, 利用DouglasPeuker算法(简称DP算法)对空间对象进行顾及误差的采样, 将采样结果通过树型结构进行保存, 从而实现针对可视化应用的高效的空间近似查询处理。

本文将地理空间对象分为顶点、线对象及组合对象,其中顶点为基本单元。线对象由顶点组成,组合对象由线对象组成。线对象的近似通过顶点采样实现,组合对象的近似通过顶点采样与线对象采样来实现。本文所提方法的基本流程是:通过传统的线简化算法为空间对象的组成单元建立序列,并通过此序列建立二叉树层次结构,以树型结构的误差优先广度遍历来实现空间对象的组成元素的选择,解决空间查询计算量大和查询结果集大的问题。

本文分析了目前的空间查询处理技术与数据交互式可视化的需求之间的矛盾, 提出了基于地理要素数据集针对交互式可视化的空间近似查询的概念及其实现方案。本文提出了针对可视化的几何对象采样误差的定义, 并将窗口查询、截取操作、采样操作等几何对象的操作方法进行结合,提出了以误差和容量为条件的窗口近似查询的概念及其处理方法,即结合线简化算法与二叉树层次结构实现空间对象的顶点实时采样。为提高数据预处理性能,本文在分布式内存计算环境中进行数据预处理, 实现计算密集任务的快速完成。在提出窗口近似查询方案的基础上, 本文使用OpenStreetMap数据进行实验,实验结果证实了所提出方法的有效性与实用性。

空间近似查询是平衡空间查询性能与空间数据集结果精度的非常有效的方法, 本文所提出的方案目前只考虑到针对特定应用即交互多可视化的窗口近似查询的处理方法, 针对其他应用如聚类分析、网络分析等的近似查询处理需要进一步研究探索,同时本文未全面讨论高频更新操作对于近似查询方法的影响, 即高度动态化地理空间数据集的近似查询问题也有待进一步的深入研究。

常规的空间地理信息描述方法(地理要素的分布式空间近似查询处理方法)(1)

往期热点文章链接

2017年(第42卷)第6期

关于《测绘科学》

主管:国家测绘地理信息局

主办:中国测绘科学研究院

邮箱:niu@casm.ac.cn

网站:http://chkd.cbpt.cnki.net

编务QQ:2378225509

《测绘科学》微信公众号

,