[1] 裴英博,刘晓霞. 文本分类中改进型CHI特征选择方法的研究[J]. 计算机工程与应用, 2011,47(4):128-130.
[2] 蒋健. 文本分类中特征提取和特征加权方法研究[D]. 重庆:重庆大学, 2010.
[3] 张玉芳,陈小莉,熊忠阳. 基于信息增益的特征词权重调整算法研究[J]. 计算机工程与应用, 2007,43(35):159-161.
[4] SALTON G, MCGILL M J. Introduction to modern information retrieval[J]. Information Processing & Management, 1983,19(6):402-403.
[5] 缪鸣燕,董卫国,胡亚华. 电子病历与手写病历在中医肛肠科中的应用效果对比分析[J]. 中医药导报, 2015,21(3):101-103.
[6] JIN C X, MA T H, HOU R T, et al. Chi-square statistics feature selection based on term frequency and distribution for text categorization[J]. IETE Journal of Research, 2015,61(4):351-362.
[7] 高宝林,周治国,杨文维,等. 基于类别和改进的CHI相结合的特征选择方法[J]. 计算机应用研究, 2018,35(6):1660-1662.
[8] 王露瑶,张涛,陈才,等. 基于卡方统计改进的TF-IDF的文本分类的研究[J]. 电子世界, 2019(6):24-25.
[9] 张玉杰. 基于偏斜数据集的中文文本分类问题的改进特征权重算法研究[D]. 长春:东北师范大学, 2010.
[10]杨文维. 基于微博特征的情感分析方法研究[D]. 长春:东北师范大学, 2018.
[11]童欣. 面向客服互动微博的短文本分类方法研究[D]. 北京:北京邮电大学, 2015.
[12]张保富,施化吉,马素琴. 基于TFIDF文本特征加权方法的改进研究[J]. 计算机应用与软件, 2011,28(2):17-20.
[13]朱菊花. 中文网页分类技术的研究与实现[D]. 成都:西南交通大学, 2008.
[14]李学明,李海瑞,薛亮,等. 基于信息增益与信息熵的TFIDF算法[J]. 计算机工程, 2012,38(8):37-40.
[15]SHAH F P, PATEL V. A review on feature selection and feature extraction for text classification[C]// IEEE International Conference on Wireless Communications, Signal Processing and Networking. 2016:2264-2268.
[16]王振. 基于机器学习的文本分类研究与实现[D]. 南京:南京邮电大学, 2018.
[17]程春惠,何钦铭. 面向不均衡类别朴素贝叶斯犯罪案件文本分类[J]. 计算机工程与应用, 2009,45(35):126-128.
[18]YANG C, DURAISWAMI R, GUMEROV N, et al. Improved fast Gauss transform and efficient kernel density estimation[C]// IEEE International Conference on Computer Vision. 2003:464-471.
[19]梁伍七,李斌,许磊. 基于类别的CHI特征选择方法[J]. 安徽广播电视大学学报, 2015(3):124-128.
[20]崔志刚. 基于电商网站商品评论数据的用户情感分析[D]. 北京:北京交通大学, 2014.
[21]姚海英. 中文文本分类中卡方统计特征选择方法和TF-IDF权重计算方法的研究[D]. 长春:吉林大学, 2016.
[22]CHEN T Q, GUESTRIN C. XGBoost: A scalable tree boosting system[C]// Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2016:785-794.
[23]辛竹,周亚建. 文本分类中互信息特征选择方法的研究与算法改进[J].计算机应用, 2013,33(S2):116-118.
|