摘要: 目前,针对不完整数据的集成分类算法没有考虑缺失属性之间的差异,在衡量各个子分类器的权值时仅仅考虑了数据集的大小以及包含属性的多少,并没有考虑各个数据子集之间属性的差异度。本文利用信息熵对各个子数据集的重要程度进行量化,进而评估从该数据集构建出的分类器的权值,使得在最终的加权投票过程更加公平,最终结果更加准确。使用基于multi-class AdaBoost的集成分类算法,以BP算法为基础分类器,对来自UCI的数据集进行实验,实验结果表明该算法在一定程度上提高了不完整数据的分类精度。
中图分类号:
吕靖;舒礼莲. 基于AdaBoost的不完整数据的信息熵分类算法[J]. 计算机与现代化, 2013, 1(9): 31-34.
LYU Jing;SHU Li-lian. Incomplete Data Information Entropy Classification Algorithm Based on AdaBoost[J]. Computer and Modernization, 2013, 1(9): 31-34.