计算机与现代化

• 应用与开发 • 上一篇    下一篇

分布式计算系统回卷恢复容错的仿真设计

  

  1. 1.杰瑞深软科技有限公司,江苏连云港222061; 2.江苏自动化研究所,江苏连云港222061;
    3.淮海工学院理学院,江苏连云港222005
  • 收稿日期:2016-07-13 出版日期:2017-04-20 发布日期:2017-05-08
  • 作者简介:董奇(1982-),男,江苏连云港人,杰瑞深软科技有限公司工程师,学士,研究方向:分布式计算,控制软件; 黄斌(1971-),男,研究员,硕士,研究方向:信息系统集成; 颜耀(1979-),男,高级工程师,研究方向:自动控制,信息系统集成; 李韦韦(1982-),女,江苏自动化研究所工程师,硕士,研究方向:计算机网络; 曾玮妮(1982-),女,高级工程师,博士,研究方向:无线自组网络; 张恒,男,淮海工学院理学院讲师,博士,研究方向:智能计算,网络化控制。
  • 基金资助:
    国家自然科学基金资助项目(61303045,61503147,71401060); 江苏省自然科学基金资助项目(BK2012237); 江苏省高校自然科学研究面上项目(15KJB510002); 连云港市科技计划项目(CA1505,CG1501,CK1331,CN1321)

Design of Rollback Recovery Fault Tolerance Simulation for Distributed System

  1. 1. JARI Deepsoft Technology Co. Ltd., Lianyungang 222061, China; 
    2. Jiangsu Automation Research Institute, Lianyungang 222061, China;
    3. School of Science, Huaihai Institute of Technology, Lianyungang 222005, China
  • Received:2016-07-13 Online:2017-04-20 Published:2017-05-08

摘要: 为了解决分布式计算系统回卷恢复容错的验证评估问题,设计一种分布式计算系统的回卷恢复容错算法的仿真机制,依据分布式计算系统回卷恢复容错的总体架构,将分布式计算系统中的节点任务过程使用离散事件模拟,在网络系统仿真工具的应用层增加支持多任务回卷恢复容错仿真的模块,并设计用于回卷恢复容错仿真的结构、功能模块和系统参数设定。结果表明本文提出的仿真机制能够实现分布式计算系统的回卷恢复容错算法的模拟验证,为不同容错算法间对比、改进与优化提供参照。

关键词: 分布式计算, 容错, 回卷恢复, 仿真

Abstract: In order to solve the evaluation problem of the rollback recovery fault tolerance in the distributed computing system, a rollback recovery fault tolerance simulation was designed. According to the structure of the rollback recovery fault tolerance scheme, the nodes task process of the distributed computing system was simulated by the discrete events. The simulation function of the rollback recovery fault tolerance was added in the application layer based on the network simulation software. The related structure, function modules and system parameters were introduced in the proposed simulation. Finally, the proposal was evaluated that the proposed simulation method is capable of the evaluation of the different rollback recovery fault tolerance scheme, and can be utilized to compare, improve and optimize the related fault tolerant algorithms.

Key words: distributed computing, fault tolerance, rollback recovery, simulation

中图分类号: