摘要: 文本主题提取技术能够有效地精炼文本消息,传统的中文文本由最基本的词语组成,由于词汇本身的信息粒度过小,针对词语进行中文信息抽取不能完整表达文本片段的语义信息。短语本身包含较为丰富的细粒度语义信息,更能表达出文本片段的主题性。本文提出基于双层语料过滤器(词性过滤器与短语扩展规则过滤器)的方法来进行文本语料的冗余信息过滤并抽取文本主题短语信息。实验证明,本文的方法具有一定的可靠性和应用性。
中图分类号:
林波1,林伟佳2,郭靖羽1,丁东辉2,黄翰2. 基于双层语料过滤器的短语抽取方法[J]. 计算机与现代化, 2015, 0(12): 7-.
LIN Bo1, LIN Weijia2, GUO Jingyu1, DING Donghui2, HUANG Han2. Text Topic Extraction Based on Doublelinguisticfilter[J]. Computer and Modernization, 2015, 0(12): 7-.