计算机与现代化

• 数据库与数据挖掘 • 上一篇    下一篇

基于Pentaho的数据中心研究及应用

  

  1. (1.华北计算技术研究所,北京100083;2.太极计算机股份有限公司,北京100083)
  • 收稿日期:2015-06-09 出版日期:2015-11-12 发布日期:2015-11-16
  • 作者简介:范鑫(1990-),男,山西怀仁人,华北计算技术研究所硕士研究生,研究方向:数据挖掘; 何中威(1992-),男,湖北红安人,硕士研究生,研究方向:软件测试; 张素伟(1959-),男,北京人,太极计算机股份有限公司研究员,高级工程师,研究方向:组件开发技术,软件构件技术与集成。

Research and Application of Data Warehouse Based on Pentaho

  1. (1. North China Institute of Computing Technology, Beijing 100083, China; 2. Taiji Computer Corporation Limited, Beijing 100083, China)
  • Received:2015-06-09 Online:2015-11-12 Published:2015-11-16

摘要:

数据中隐藏的价值不仅决定企业自身的命运同时承载整个行业的未来发展方向。在大数据时代背景下,无论是公司的发展还是政府的管理,搭建属于自身的数据仓库都显得尤为重要。本文借助中关村数据融合中心平台,阐述构建基于Pentaho管理系统的关键技术要点,主要包括数据仓库的设计,数据收集过程中的ETL设计,数据分析过程中的OLAP设计,数据展示过程中的报表设计。

关键词: 大数据, 数据仓库, Pentaho平台, 数据加载转换, OLAP

Abstract:

The hidden value of data not only determines the fate of the enterprise itself, but also carries the future direction of the whole industry. Under the background of big data era, whether the development of the company or government management, building a data warehouse to themselves is particularly important. Based on the Zhongguancun data fusion center platform, the paper expounds the key technology points of building the Pentaho management system which mainly includes the design of the data warehouse, ETL design of data collection process, OLAP design of data analysis process and report design in the data display process.

Key words: big data, data warehouse, Pentaho platform, ETL, OLAP

中图分类号: