计算机与现代化

• 人工智能 • 上一篇    下一篇

面向研究性项目文档的知识画像模型

  

  1. (华北计算技术研究所,北京100083)
  • 收稿日期:2019-08-22 出版日期:2020-03-03 发布日期:2020-03-03
  • 作者简介:武迪(1995-),男,内蒙古呼和浩特人,硕士研究生,研究方向:大数据分析,自然语言处理,E-mail: wd369123@126.com ; 艾中良(1971-),男,研究员,研究方向:大数据分析技术,人工智能技术,E-mail: aizl067@sina.com; 刘忠麟(1984-),男,工程师,研究方向:大数据分析,E-mail: 2933462260@qq.com; 李常宝(1980-),男,高级工程师,博士,研究方向:大数据分析,自然语言处理,E-mail: lichangbao_1@163.com。

Knowledge Portrait Model for Research Project Documents

  1. (North China Institute of Computing Technology, Beijing 100083, China) 
  • Received:2019-08-22 Online:2020-03-03 Published:2020-03-03

摘要: 为提高科研活动产生的研究性项目文档的知识要点的精准智能识别和检索能力,通过分析文档行文结构,提出建立文档知识画像的方法。设计精准贴合研究性项目文档结构的多层次的知识画像,自动识别文档知识要点,并按语义段落多粒度提取知识要点。采用知识表达准确率对模型的知识提取精确度进行检验,实验结果表明模型比传统方法对文档知识描述更准确,可在实际工作中使用。

关键词: 研究性项目文档, 知识画像, 知识提取, 文档描述模型, 结构要素

Abstract: Aiming to improve the ability of accurate and intelligent identification of the knowledge points of the research project documents produced by research activities, we analyzed the document structure and proposed a method for establishing document knowledge portrait. A multi-level knowledge portrait fitting the structure of documents is designed. It identified the key points of the document knowledge automatically and extracted the knowledge points according to the multi-granularity of the semantic paragraph. The accuracy of knowledge extraction is used to test the accuracy of the model. The experimental results show that the model is more accurate than the traditional method for document knowledge description and can be used in practical application.

Key words: research project document, knowledge portrait, knowledge extraction, document description model, structural elements

中图分类号: