计算机与现代化 ›› 2012, Vol. 1 ›› Issue (200): 64-04.doi: 10.3969/j.issn.1006-2475.2012.04.017

• 数据库与数据挖掘 • 上一篇    下一篇

网络新闻信息挖掘与分析模型的建立与探讨

刘林浩   

  1. 湖南文理学院,湖南 常德 415000
  • 收稿日期:2012-01-13 修回日期:1900-01-01 出版日期:2012-04-16 发布日期:2012-04-16

Discussion and Establishment of Network News Information Mining and Analysis Model

LIU Lin-hao   

  1. Hunan University of Arts and Science, Changde 415000, China
  • Received:2012-01-13 Revised:1900-01-01 Online:2012-04-16 Published:2012-04-16

摘要: 运用现代信息处理技术建立一个从获取新闻源、进行信息处理、运用文本挖掘技术对信息进行分析的系统模型。该系统模型是为了最终实现能够自动化获取新闻信息,并且可以对网络中的新闻进行自动分类和聚类,为用户推荐热门信息,描述某个热门信息在时间轴上的演化进程;协助用户以及某些机构去认识和了解网络中的信息演变进程。热点新闻信息挖掘研究的主要目的在于:可以使用户终端更全面更快地知道和了解所关心的新闻信息及其整体的发展方向;网站的维护者可以依据分析结果来更好地设计网站内容以迎合用户的最新喜好,以便较大地提高网站的质量;新闻热点信息的挖掘模型也可以给互联网演变研究给予一些帮助,使网络监督者可以更好地对网络内容进行引导和控制。

关键词: 分类, 聚类, 热点新闻, 新闻信息挖掘, KNN算法

Abstract: The paper builds a system model which involves accessing information sources, information processing and information analysis using text mining technology. The model is expected to enforce the evolution of information which consists of automatic access to news, classification and clustering, recommendation and description of evolution of a particular piece of hot news. Hot news mining benefits three parties: users, maintainers and supervisors. Users are easier to access their favorites; maintainers are able to design websites better to cater to users; supervisors can control and steer the Web more effectively.

Key words: classification, clustering, hot news, news-mining, KNN algorithm