计算机与现代化

• 数据库与数据挖掘 • 上一篇    下一篇

DOP:一种数据开放框架及其应用

  

  1. (华南师范大学计算机学院,广东广州510631)
  • 收稿日期:2018-01-19 出版日期:2018-08-23 发布日期:2018-08-27
  • 作者简介:莫城为(1990-),男,广东陆丰人,华南师范大学计算机学院硕士研究生,研究方向:数据开放,信息安全;范冰冰(1962-),男,上海人,教授,研究方向:云计算,数据融合。
  • 基金资助:
    广东省重大科技专项(2016B030305003)

DOP:ASimpleOpenDataFrameworkandItsApplication

  1. (SchoolofComputer,SouthChinaNormalUniversity,Guangzhou510631,China)
  • Received:2018-01-19 Online:2018-08-23 Published:2018-08-27

摘要: 数据开放是大数据时代的趋势,而通用工程化的开放数据平台的实施是当前面临的主要问题。本文基于元数据管理和大数据存储,提出数据开放池(Data-Open-Pool,DOP)框架和“目录—数据集—发布”(Catalog-Dataset-Distribution,CDD)数据描述模型,实现数据从采集发布到最终开放的业务逻辑及数据资源在3个层次的描述与管理,最后通过DOP和CDD分层描述模型实现简便的数据开放应用案例,并讨论该框架存在的若干问题。

关键词: 大数据, 数据开放, 元数据, 数据描述, 数据存储

Abstract: Open-dataisthetrendoftheeraofbigdata,thustocarryoutopen-dataplatformthroughgeneralengineeringapproachesisthemainproblem.Referringtotheideasofthemetadatamanagementandthebig-datastorage,thepaperproposestheDOP(Data-Open-Pool)frameworkandCDD(Catalog-Dataset-Distribution)datadescriptionmodel,whichrealizestheservicelogicfrompublishingadatasetaftercollectingdatatoopeningtothepublicfinally,aswellasthedescriptionandmanagementofdataresourcesinthethreelevels,andfinallyimplementsaneasyopen-dataapplicationwiththeDOPandCDDhierarchicaldescriptionmodel,givesthegeneralalgorithmtoreleasethestandarddatasetfromunordereddatasources,aswellasthediscussiononsomeproblemsoftheframework.

Key words: bigdata, open-data, metadata, datadescription, datastorage

中图分类号: