计算机与现代化

• 数据库与数据挖掘 • 上一篇    下一篇

基于Coreseek+Python的分布式全文检索方法

  

  1. 1.解放军电子工程学院,安徽合肥230037;2.海军指挥学院,江苏南京211800
  • 收稿日期:2014-03-20 出版日期:2014-06-13 发布日期:2014-06-25
  • 作者简介:罗盘(1988-),男,湖南娄底人,解放军电子工程学院硕士研究生,海军指挥学院讲师,研究方向:信息安全,数据挖掘; 许建南(1972-),男,副教授,硕士,研究方向:信息安全,大数据; 李忠(1989-),男,助教,本科,研究方向:信息安全,数据可视化。

 Distributed Full-text Retrieval Method Based on Coreseek and Python

  1. 1.PLA Electronic Engineering Institute, Hefei 230037, China;2.Naval Command College, Nanjing 211800, China
  • Received:2014-03-20 Online:2014-06-13 Published:2014-06-25

摘要: 将Coreseek全文检索引擎应用到分布式数据检索引擎的构建中,利用Python数据源程序接口对多种类型的数据库进行连接,使检索引擎能够同时对不同类型的数据库进行检索。该方法较好地解决了海量数据查询系统中,单极查询性能有限、数据融合复杂问题,提高了系统的数据检索速度和对不同数据库服务器的兼容性。

关键词:  , 搜索引擎, Coreseek全文检索, 分布式, Python数据源程序接口

Abstract:  This paper uses the Coreseek full-text retrieval engine to buile the distributed search engine and uses the Python database API to make connections to nearly all kind of database servers so that the search engine can search different database servers at the same time. This method solves the problem of performance limit for single server and involutes data merging in massive data search system, improves the search speed and the compatibility for different database servers of system.

Key words: search engine, Coreseek full-text retrieval, distribute, Python database API