计算机与现代化

• 人工智能 •    下一篇

中文产品评论结构化引擎

  

  1. (1.中国电子科技集团公司第十五研究所航空信息系统部,北京 100083; 2.清华大学管理科学与工程系,北京 100084; 3.中国人民大学信息学院,北京 100872)
  • 收稿日期:2014-05-26 出版日期:2014-07-16 发布日期:2014-07-17
  • 作者简介:杨慧(1982-),女,内蒙古满洲里人,中国电子科技集团公司第十五研究所航空信息系统部工程师,硕士,研究方向:数据挖掘,意见挖掘; 刘红岩(1968-),女,山东人,清华大学管理科学与工程系教授,博士,研究方向:数据挖掘,意见挖掘; 何军(1962-),男,北京人,中国人民大学信息学院副教授,博士,研究方向:数据库,数据挖掘,信息检索,计算机网络。
  • 基金资助:
    国家自然科学基金资助项目(70471006, 70621061, 60496325, 60573092)

A Structured System of Mining Chinese Product Reviews

  1. (1. Department of Aviation Information System, The 15th Institute, China Electronics Technology Group Corporation, Beijing 100083, China;
    2. Department of Management Science and Engineering, Tsinghua University, Beijing 100084, China;
    3. School of Information, Renmin University of China, Beijing 100872, China)
  • Received:2014-05-26 Online:2014-07-16 Published:2014-07-17

摘要: 为实现网络上非领域相关的中文产品评论信息的搜索及结构化,设计并实现中文产品评论结构化引擎,该引擎通过抓取网络上指定产品的评论,抽取评论中的特征与意见,判断意见的极型,将评论以(特征,意见,极型)的结构化形式输出给用户。其中特征意见抽取解决了产品隐形特征抽取问题。实验结果表明该引擎的特征意见召回率与准确率、意见极型判断准确率等指标可以满足用户需要。

关键词: 意见挖掘, 产品评论结构化, 特征抽取, 感情色彩判断

Abstract: We designed and implemented a structured system of mining Chinese product reviews. According to the user’s specified product names, the system could grab reviews about the product on Internet, extract product features and automatically determine the polarity of context-dependent opinions and then return a structured result of the reviews as the triple (feature, opinion, polarity). The experiment proved the effectiveness of the algorithms. And it made an acceptable precision and recall.

Key words: opinion mining, structured product review, feature extraction, sentiment analysis

中图分类号: