计算机与现代化

• 信息系统 • 上一篇    下一篇

基于ElasticSearch的数字图书馆检索系统

  

  1. (1.中南大学信息科学与工程学院,湖南长沙410083;2.中南大学软件学院,湖南长沙410075;3.中南大学图书馆,湖南长沙410083)
  • 收稿日期:2015-02-03 出版日期:2015-06-16 发布日期:2015-06-18
  • 作者简介:张建中(1955-),男,河北张家口人,中南大学信息科学与工程学院教授,博士,研究方向:数字图书馆,信息处理;黄艳飞(1989-),男,河北邯郸人,中南大学软件学院硕士研究生,研究方向:数字图书馆文献检索; 熊拥军(1972-),男,湖南长沙人,中南大学图书馆副研究馆员,博士,研究方向:数字图书馆,信息处理。

Digital Library Retrieval System Based on ElasticSearch

  1. (1. School of Information Science and Engineering, Central South University, Changsha 410083, China; 2. School of Software, Central South University, Changsha 410075, China; 3. Central South University Library, Changsha 410083, China)
  • Received:2015-02-03 Online:2015-06-16 Published:2015-06-18

摘要: 针对大数据时代下图书馆文献的存储和检索难题,运用HDFS分布式文件系统实现图书馆文献资源的海量存储,釆用ElasticSearch分布式索引技术对资源进行分布式索引和检索,构建了一个高效的、分布式的数字图书馆检索系统。测试结果显示,在大数据量下,系统检索时间约为传统Oracle数据库检索时间的1/20,并带有缓存功能。

关键词: ElasticSearch, 数字图书馆, 海量存储, 分布式索引, 分布式检索

Abstract: For the storage and retrieval problem of library works in the era of big data, this paper implemented the massive storage of library works with HDFS and used ElasticSearch to distributed index and retrieval. Test results show that under the large amount of data, this system needs about onetwentieth retrieval time of the traditional Oracle database for searching the same search words, and it has the cache function. So an efficient and distributed digital library retrieval system is built.

Key words: ElasticSearch, digital library, mass storage, distributed index, distributed retrieval

中图分类号: