%0 Journal Article %A 李富星 %A 蒙祖强 %T 一种改进的类别区分词特征选择算法 %D 2019 %R 10.3969/j.issn.1006-2475.2019.03.014 %J 计算机与现代化 %P 73- %V 0 %N 03 %X 传统类别区分词特征选择算法以类间分散度和类内重要度作为度量指标,忽略了2个指标对特征评分函数的贡献权重往往不同这一事实,从而在一定程度上影响了特征选择效果。在类别区分词特征选择算法基础上,引入平衡因子,通过调节平衡因子来调整2个指标对特征评价函数的贡献权重,完成更加高效的特征选择,进而达到更好的文本分类效果。使用朴素贝叶斯算法进行文本分类,相比主流特征选择算法,改进算法在分类准确率、查准率、查全率和F1指标上都取得了可观的性能提升。

 

%U http://www.c-a-m.org.cn/CN/10.3969/j.issn.1006-2475.2019.03.014