[1] 黄令贺. 网络百科信息质量动态演进探索研究[J/OL]. 情报理论与实践. (2017-11-23)[2018-08-15]. http://kns.cnki.net/kcms/detail/11.1762.G3.20171123.1121.016.html.
[2] 李太白. 短文本分类中特征选择算法的研究[D]. 重庆:重庆师范大学, 2013.
[3] 宗成庆. 统计自然语言处理[M]. 北京:清华大学出版社, 2013.
[4] ROGATI M, YANG Y M. High-performing feature selection for text classification[C]// Proceedings of the 11th ACM International Conference on Information and Knowledge Management. 2002:659-661.
[5] 邱云飞,王建坤,李雪,等. 基于线性组合文本特征选择方法[J]. 计算机应用研究, 2011,28(6):2099-2101.
[6] 张玉芳,万斌候,熊忠阳. 文本分类中的特征降维方法研究[J]. 计算机应用研究, 2012,29(7):2541-2543.
[7] 吕建新,郑伟. 互信息特征选择方法的研究与改进[J]. 情报科学, 2014,32(8):82-84.
[8] 袁磊. 基于改进CHI特征选择的情感文本分类研究[J]. 传感器与微系统, 2017,36(5):47-51.
[9] 裘国永,王娜,汪万紫. 基于互信息和遗传算法的两阶段特征选择方法[J]. 计算机应用研究, 2012,29(8):2903-2905.
[10]毛雅楠. 基于一种改进特征选择方法的股票分类研究[D]. 北京:北京交通大学, 2017.
[11]袁满,欧阳元新,熊璋,等. 一种基于频繁词集的短文本特征扩展方法[J]. 东南大学学报(自然科学版), 2014,44(2):256-260.
[12]罗燕. 基于维基百科的短文本处理方法[D]. 石家庄:河北师范大学, 2016.
[13]BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003,3:993-1022.
[14]张猛. 基于LDA的短文本分类中特征扩展方法的研究[D]. 北京:中国地质大学, 2017.
[15]MIKOLOY T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space[J]. Computer Science, 2013,arXiv:1301.3781.
[16]江大鹏. 基于词向量的短文本分类方法研究[D]. 杭州:浙江大学, 2015.
[17]唐明,朱磊,邹显春. 基于Word2Vec的一种文档向量表示[J]. 计算机科学, 2016,43(6):214-217,269.
[18]ZHENG Z H, WU X Y, SRIHARI R K. Feature selection for text categorization on imbalanced data[J]. ACM SIGKDD Explorations Newsletter, 2004,6(1):80-89.
[19]赵云志. 统计分析法自动标引的改进[J]. 情报学报, 2000,19(4):333-337.
[20]侯汉清,章成志,郑红. Web概念挖掘中标引源加权方案初探[J]. 情报学报, 2005,24(1):87-92.
[21]朱陈柔玲,张达敏,张慕雪,等. 遗传算法在图像处理中的应用[J]. 通信技术, 2017(7):1401-1406.
[22]周明,孙树栋. 遗传算法原理及应用[M]. 北京:国防工业出版社, 1999.
[23]奉国和. 文本分类性能评价研究[J]. 情报杂志, 2011,30(8):66-70. |