摘要: 目前,话题检测与跟踪已被广泛应用,新事件检测作为话题检测与跟踪领域中的研究任务之一,为跟踪后续话题发展的先验知识,在话题检测与跟踪领域具有重要的理论研究意义。LDA主题模型不能自动识别新事件,其主题数需通过人工或反复实验来确定,识别效率低。本文提出基于LDA及主题词间的相关性新事件检测算法,同时结合报道发生的时间,确定合理的主题数目,从而探知新事件。实验证明,与传统LDA算法及Gibbs LDA算法相比,该方法具有一定优势,提高了对新事件检测的敏感度。
中图分类号:
黄颖. LDA及主题词相关性的新事件检测[J]. 计算机与现代化, 2012, 1(1): 6-9,13.
HUANG Ying. New Event Detection Based on LDA and Correlation of Topic Terms[J]. Computer and Modernization, 2012, 1(1): 6-9,13.