计算机与现代化

• 数据库与数据挖掘 • 上一篇    下一篇

基于分区的Elias-Fano-Golomb-Rice倒排索引压缩算法

  

  1. 北京交通大学计算机与信息技术学院,北京  100044
  • 收稿日期:2016-12-26 出版日期:2017-09-20 发布日期:2017-09-19
  • 作者简介:李俊廷(1991-),男,安徽阜阳人,北京交通大学计算机与信息技术学院硕士研究生,研究方向:信息检索; 瞿有利(1974-),男,高级工程师,博士,研究方向:信息检索。
  • 基金资助:
    中央高校基本科研业务费专项资金资助项目(2015JBM035)

A Partitioned Elias-Fano-Golomb-Rice Index Invertal Compression Algorithm

  1. School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China
  • Received:2016-12-26 Online:2017-09-20 Published:2017-09-19

摘要: 基于分区的Elias-Fano算法被应用于倒排索引压缩,显示出良好的空间压缩性能。本文证明了Golomb-Rice算法的压缩性能优于Elias-Fano算法。结合基于分区的Elias-Fano算法中“分区”思想,提出一种基于分区的Elias-Fano-Golomb-Rice倒排索引压缩算法。实验结果表明,与其他倒排索引压缩算法相比,基于分区的Elias-Fano-Golomb-Rice倒排索引压缩算法有更好的压缩性能。

关键词: 倒排索引, 索引压缩, 分区

Abstract: The partitioned Elias-Fano algorithm was applied to the compression of inverted indexes, showing good compression performance. This paper proves Golomb-Rice algorithm offers better compression than Elias-Fano. Combining with the basic idea ‘partition’ of partitioned Elias-Fano algorithm, we propose partitioned Elias-Fano-Golomb-Rice index compression algorithm. Experimental results show that the partitioned Elias-Fano-Golomb-Rice index compression algorithm provides better compression, compared with partitioned Elias-Fano algorithmand other compression algorithms of inverted indexes.

Key words: inverted index, index compression, partition

中图分类号: