计算机与现代化 ›› 2013, Vol. 1 ›› Issue (3): 1-4,8.doi:
• 算法分析与设计 • 下一篇
郝晓飞1,谭跃生2,王静宇2
HAO Xiao-fei1, TAN Yue-sheng2, WANG Jing-yu2
摘要: 分析传统串行关联规则Apriori算法的计算过程以及存在的一些缺点,针对串行算法执行效率低,时间复杂度高以及传统并行计算模式不能处理节点失效,难以处理负载均衡等问题,提出基于Hadoop平台实现并行关联规则算法的设计方法,对传统关联规则Apriori算法进行了改进,并给出改进算法在Hadoop平台的MapReduce编程模型上的执行流程;在Hadoop平台上对改进后的算法进行单机测试和集群测试,实验结果证明,改进后的算法具有较高的执行效率,良好的加速比和可移植性。