摘要: 使用基于PAT-Tree的候选短语提取算法,通过修改PAT-Tree数据结构使之适合处理变长中文字符串及非中文字符。根据交互信息评估字符串的关联程度,并结合新闻报道和网络热词的特点提出向前过滤算法发现网络热词。与其它同类算法相比,本算法不需要制定复杂的语言规则和候选短语的评分公式,实现更加简单、速度更快。实验证明了本文算法的有效性和正确性。
郭冲. 基于新闻标题的网络热词发现算法[J]. 计算机与现代化, 2013, 1(3): 58-62,6.
GUO Chong. Algorithm of Network Hot Word Detection Based on News Title[J]. Computer and Modernization, 2013, 1(3): 58-62,6.