计算机与现代化

• 应用与开发 • 上一篇    下一篇

一种基于介词用法的灾难事件信息抽取方法

  

  1.  郑州师范学院信息科学与技术学院,河南郑州450044
  • 收稿日期:2015-03-04 出版日期:2015-07-23 发布日期:2015-07-28
  • 作者简介:贾遂民(1968-),男,河南新郑人,郑州师范学院信息科学与技术学院副教授,研究方向:信息处理,数据挖掘; 张玉(1982-),女,河南郑州人,讲师,硕士,研究方向:并行计算,数据挖掘; 张腾飞(1986-),男,河南平顶山人,讲师,硕士,研究方向:自然语言处理。
  • 基金资助:
    中国博士后科学基金资助项目(2012M510110); 河南省科技攻关项目(112102110153)

A Disaster Event Information Extraction Method Based on Preposition’s Usages

  1. College of Information Science & Technology, Zhengzhou Normal University, Zhengzhou 450044, China
  • Received:2015-03-04 Online:2015-07-23 Published:2015-07-28

摘要: 为提高事件信息抽取技术的准确率,通过对文本中介词用法进行识别,采用一种条件随机场统计模型和介词用法信息相结合的事件信息抽取方法,完成抽取系统的编写,以达到理想的抽取结果。本文采用《人民日报》作为实验语料,通过大量实验,结果准确率达到90.33%,比不含介词用法信息的方法提高9.14%,证明了此方法的有效性。

关键词: 信息抽取, 介词用法, 灾难事件, 事件元素, 条件随机场

Abstract: To improve the efficiency of the event information extraction, through the recognition of preposition’s usages in text, an approach based on preposition’s usages and Conditional Random Fields(CRFs) is proposed for event information extracting, and the paper completes the coding of extraction system, in order to achieve the better extraction result. “People’s Daily” is used as experiment corpus, the approach achieves a better performance, the precision rate reaches 90.33%, increases 9.14% than the method without preposition’s usage.

Key words: information extraction; preposition&rsquo, s usages; disaster event; event element; CRFs

中图分类号: