摘要: 针对水利普查数据海量、多维的特点,研究近年来在“大数据”概念下发展迅速的Hadoop与Hive,结合传统数据仓库在多维数据分析方面的成熟技术,提出基于Hive的水利普查数据仓库的构建方法,描述数据仓库系统的架构,并根据Hive的设计特点,通过分桶、消减维度表和冗余事实表的方法来改进传统的多维分析模型,最后搭建集群系统对水利普查数据集进行查询与分析测试。测试结果表明该数据仓库可以满足海量多维水利普查数据的存储与查询要求。
中图分类号:
陈 龙,万定生,顾昕辰. 基于Hive的水利普查数据仓库[J]. 计算机与现代化, 2014, 0(5): 127-130.
CHEN Long, WAN Ding-sheng, GU Xin-chen. Water Census Data Warehouse Based on Hive[J]. Computer and Modernization, 2014, 0(5): 127-130.