计算机与现代化 ›› 2014, Vol. 0 ›› Issue (6): 1-6.

• 数据库与数据挖掘 •    下一篇

一种基于本体的异构数据语义抽取方法

  

  1. 北京科技大学计算机与通信工程学院,北京100083
  • 收稿日期:2014-04-18 出版日期:2014-06-13 发布日期:2014-06-25
  • 作者简介:成欣(1983-),女,河南安阳人,北京科技大学计算机与通信工程学院博士研究生,研究方向:领域数据工程与知识工程; 李扬(1983-),女,山东青岛人,讲师,博士,研究方向:进化计算,领域数据工程与知识工程。
  • 基金资助:
     国家科技基础条件平台建设项目(2005DKA32800); 材料领域知识工程北京市重点实验室2012年度阶梯计划资助项目(Z121101002812005); 十二五国家科技支撑计划资助项目(2011BAK08B04); 973国家重点基础研究发展计划资助项目(2013CB329606)

An Ontology-based Semantic Extraction Method of Heterogeneous Data

  1. School of Computer and Communication Engineering, University of Science and Technology Beijing, Beijing 100083, China
  • Received:2014-04-18 Online:2014-06-13 Published:2014-06-25

摘要: 针对领域科学数据异构多样、缺乏语义的问题,本文提出一种基于本体的异构数据语义抽取方法。首先,构建领域科学数据的语义抽取框架,并在此基础上分别针对结构化、半结构化以及非结构化数据制定相应的语义转换与抽取规则,形成局部领域本体;然后,通过异构数据间的关联映射,构建领域数据的全局本体,实现异构数据的有效组织与统一管理;最后,将相关方法应用到材料领域,为材料科学数据的有效管理与共享服务提供支撑。

关键词:  , 本体, 异构数据, 语义抽取, 数据集成, 领域科学数据

Abstract: For the issues of heterogeneous and lack of semantics about scientific data, this paper proposes an ontology-based semantic extraction method of heterogeneous data. Firstly, we construct the semantic extraction framework of scientific data, and on this basis, respectively formulate the corresponding semantic conversion and extraction  rules for the structured, semi-structured and unstructured data, thus form the local domain ontology. Secondly, we construct the global ontology of domain data through the association mapping, and then achieve the effective organization and unified management of heterogeneous data. Finally, we apply the related method to the field of materials, and realize the effective data management and sharing service in the field of materials.

Key words:  ontology, heterogeneous data, semantic extraction, data integration, domain scientific data