计算机与现代化

• 算法设计与分析 • 上一篇    下一篇

基于OpenCL的双GPU基数排序算法

  

  1. (1.南京航空航天大学计算机科学与技术学院,江苏南京210016;
    2.南京理工大学计算机科学与工程学院,江苏南京210094)
  • 收稿日期:2014-09-28 出版日期:2015-01-19 发布日期:2015-01-21
  • 作者简介:赵成龙(1989-),男,江苏徐州人,南京航空航天大学计算机科学与技术学院硕士研究生,研究方向:计算机系统结构; 施慧彬(1966-),男,副教授,研究方向:计算机系统结构,可重构计算,编译优化技术; 俞忻峰(1990-),男,南京理工大学计算机科学与工程学院硕士研究生,研究方向:数据挖掘。
  • 基金资助:
    radix sort; parallel computing; load balancing

Dual GPU Radix Sort Algorithm Based on OpenCL

  1. (1. College of Computer Science and Technology, Nanjing University of Aeronautics and Astronautics, Nanjing 210016, China;
    2. School of Computer Science and Engineering, Nanjing University of Science & Technology, Nanjing 210094, China)
  • Received:2014-09-28 Online:2015-01-19 Published:2015-01-21

摘要: 为提高基数排序算法在异构并行平台下的资源利用率和算法加速比,提出基于OpenCL的双GPU基数排序算法。通过研究并行基数排序思想,以Y485P作为实验平台,使用OpenCL技术首先实现单GPU的基数排序算法,之后实现负载平衡的双GPU基数排序。测试结果表明,在使用单GPU时加速比为1.3x,使用双GPU时加速比为2.32x。

关键词: 基数排序, 并行计算, 负载均衡

Abstract:  In order to improve resource utilization rate and algorithm acceleration ratio of radix sort on heterogeneous parallel platform, this thesis proposed the implementation of dual GPU radix sort algorithm based on OpenCL. Through research the idea of parallel radix sort, this thesis uses Y485P as exprimental platform, firstly realizes the radix sort on single GPU based on OpenCL, then realizes the radix sort on dual GPU by load balancing. Test results show that when using single GPU, the speedup is 1.3x, using dual GPU is 2.32x.

中图分类号: