计算机与现代化

• 算法设计与分析 • 上一篇    下一篇

基于增量学习的非平衡SVM分类方法

  

  1. (1.长治学院沁县师范分院,山西长治046400;2.山西大学计算机与信息技术学院,山西太原030006)
  • 收稿日期:2017-11-17 出版日期:2018-08-23 发布日期:2018-08-27
  • 作者简介:崔丽娜(1981-),女,山西武乡人,长治学院沁县师范分院助教,硕士,研究方向:数据挖掘与智能信息处理;通信作者:郭虎升(1986-),男,山西太谷人,山西大学计算机与信息技术学院副教授,硕士生导师,博士,研究方向:人工智能,数据挖掘,机器学习,大数据分析与处理。
  • 基金资助:
    国家自然科学基金资助项目(61503229);山西省自然科学基金资助项目(2015021096);山西省高等学校科技创新项目(2015110)

ImbalancedSVMClassificationMethodBasedonIncrementalLearning

  1. (1.QinxianNormalInstitute,ChangzhiUniversity,Changzhi046400,China;
     2.SchoolofComputerandInformationTechnology,ShanxiUniversity,Taiyuan030006,China)
  • Received:2017-11-17 Online:2018-08-23 Published:2018-08-27

摘要: 针对传统支持向量机(SupportVectorMachine,SVM)无法有效处理非平衡分类的问题,提出一种基于增量学习的非平衡SVM分类方法(ImbalancedSVMBasedonIncrementalLearning,ISVM_IL)。该方法首先提取多数类样本中的部分样本,与少数类样本合并参与训练得到初始分类器,然后根据分类器与其他样本的关系,选择距离分类器最近的样本作为增量样本加入训练集参与训练,从而减小实际参与训练的负类数据规模,提高非平衡分类的性能。实验结果表明,本文提出的ISVM_IL方法可以有效提高非平衡分类中重要的少数类样本的分类性能。

关键词: 支持向量机, 非平衡分类, 增量学习, ISVM_IL算法

Abstract: Thispaperpresentsanimbalancedsupportvectormachine(SVM)basedonincrementallearning,namelyISVM_IL,tosolvetheimbalancedclassificationproblemthatthetraditionalSVMclassificationmethodcannotsolve.Firstly,thismethodextractssomesamplesfromthemajoritynegativeclass,andtheinitialclassifiercanbeobtainedbytrainingSVMonthesesamplesandminoritypositiveclasssample.Then,accordingtotherelationshipbetweentheclassifierandothernegativesamples,thenearestsampletotheclassifierisselectedasanincrementalsampletojointhetrainingsettoparticipateintheSVMtraining.Therefore,thenegativeclasssizeoftheactualtrainingisreducedandtheperformanceofimbalancedclassificationisimproved.TheexperimentresultdemonstratesthattheproposedISVM_ILmethodcanimprovetheclassificationperformanceofimportantminorityclasssampleofimbalancedclassification.

Key words: supportvectormachine, imbalancedclassification, incrementallearning, ISVM_ILalgorithm

中图分类号: