[1] 庞进武,程益联,罗志东. 水利普查与信息化[J]. 水利信息化, 2012(1):19-22.
[2] 陈龙,万定生,顾昕辰. 基于Hive的水利普查数据仓库[J]. 计算机与现代化, 2014(5):127-130.
[3] 毛国君,段立娟,王实,等. 数据挖掘原理与算法[M]. 北京:清华大学出版社, 2005.
[4] 丁静,杨善林,罗贺,等. 云计算环境下的数据挖掘服务模式[J]. 计算机科学, 2012,39(S1):217-219.
[5] 何清,庄福振,曾立,等. PDMiner: 基于云计算的并行分布式数据挖掘工具平台[J]. 中国科学:信息科学, 2014,44(7):871-885.
[6] 谢金梅,王艳妮. 决策树算法综述[J]. 软件导刊, 2008,7(11):83-85.
[7] 李楠,段隆振,陈萌. 决策树C4.5算法在数据挖掘中的分析及其应用[J]. 计算机与现代化, 2008(12):160-163.
[8] 姚亚夫,邢留涛. 决策树C4.5连续属性分割阈值算法改进及其应用[J]. 中南大学学报(自然科学版), 2011,42(12):3772-3776.
[9] 颜巍. 基于云平台的数据挖掘算法的研究与实现[D]. 成都:电子科技大学, 2013.
[10] 徐鹏,林森. 基于C4.5决策树的流量分类方法[J]. 软件学报, 2009,20(10):2692-2704.
[11] Dean J, Ghemawat S. MapReduce: Simplified data processing on large clusters[J]. Communications of the ACM, 2008,51(1):107-113.
[12] Borthakur D. The Hadoop Distributed File System: Architecture and Design[DB/OL]. http://web.mit.edu/~mriap/hadoop/hadoop-0.13.1/docs/hdfs_design.pdf, 2007-11-21.
[13] Lam C. Hadoop实战[M]. 韩翼中,译. 北京:人民邮电出版社, 2011.
[14] Dean J, Ghemawat S. MapReduce: Simplified data processing on large clusters[C]// Proceedings of the 6th Symposium on Operating Systems Design and Implementation. 2004:137-149.
[15] 周丽娟,王慧,王文伯,等. 面向海量数据的并行KMeans算法[J]. 华中科技大学学报(自然科学版), 2012,40(S1):150-152.
[16] 潘吴斌. 基于云计算的并行K-means气象数据挖掘研究与应用[D]. 南京:南京信息工程大学, 2013.
[17] 韩光辉. 基于欧氏距离的实例选择算法研究[D]. 保定:河北大学, 2011. |