计算机与现代化

• 网络与通信 • 上一篇    下一篇

基于Hadoop的空间关键字索引方法

  

  1. (河海大学计算机与信息学院,江苏 南京 211100)
  • 收稿日期:2017-03-09 出版日期:2017-11-21 发布日期:2017-11-21
  • 作者简介:张进(1992-),男,安徽芜湖人,河海大学计算机与信息学院硕士研究生,研究方向:时空间数据管理,云计算; 冯钧(1969-),女,教授,博士,研究方向:时空间数据管理,智能数据处理与数据挖掘,水利信息化; 陆佳民(1983-),男,讲师,研究方向:移动对象数据管理,分布式数据处理。
  • 基金资助:
    国家自然科学基金资助项目(61370091, 61602151)

Spatial Keyword Index Method Based on Hadoop

  1. (College of Computer and Information, Hohai University, Nanjing 211100, China)
  • Received:2017-03-09 Online:2017-11-21 Published:2017-11-21

摘要: 随着移动互联网的兴起,在移动端产生了海量的数据,这些数据除了含有传统的文本信息外还含有空间位置信息。为了能够高效地处理和利用这些数据,高效的空间关键字索引方法已经成为业界研究的热点。但现有的空间关键字索引方法,在面对海量空间数据时还存在缺乏伸缩性和可扩展性、易产生查询热点等问题。为此,本文提出一种基于Hadoop的空间关键字索引方法,并对索引并行化算法进行优化,与已有的空间关键字索引方法进行对比。实验结果验证了本文提出的空间关键字索引方法的有效性。

关键词: 空间关键字, 索引, 分布式查询, Hadoop

Abstract: With the rise of the mobile Internet, huge amounts of data are generated from mobile terminal, these data contain not only traditional text information but also spatial location information. In order to effectively process and utilize these data, highly efficient methods of spatial keyword index have become a hot research topic in the field. But in the face of huge amounts of spatial data, the existing methods of spatial keyword index still have problems such as the lack of scalability and extensibility, easy to generate query hotspots. In order to deal with the above problems, two improvements measures are proposed in this paper: the method of spatial keyword index based on Hadoop and optimized parallelizable algorithm of index. Finally, we compare the spatial keyword index method proposed in this paper with the existing spatial keyword index methods and verify its effectiveness.

Key words: spatial keyword, index, distributed query, Hadoop

中图分类号: