[1] 何力,贾焰,韩伟红,等. 大规模层次分类问题研究及其进展[J]. 计算机学报, 2012,35(10):2101-2115.
[2] Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. The Journal of Machine Learning Research, 2003,3:993-1022.
[3] 杨柳,殷钊,腾建斌,等. 改进贝叶斯分类的智能短信分类方法[J]. 计算机科学, 2014,41(10):31-35.
[4] 刘伟,谢兴生,肖超峰. 一种基于支持向量阈值控制的优化增量SVM算法[J]. 计算机工程与应用, 2015,51(3):124-128.
[5] Macqueen J B. Some methods for classification and analysis of multivariate observations[C] // Proceedings of the 5th Berkeley Symposium on Mathematical Statistics and Probability. 1967,1:281-297.
[6] 钟将,刘荣辉. 一种改进的KNN文本分类[J]. 计算机工程与应用, 2012,48(2):142-144.
[7] 刘振鹿,王大玲,冯时,等. 一种基于LDA的潜在语义区划分及Web文档聚类算法[J]. 中文信息学报, 2011,25(1):60-67.
[8] 李文波,孙乐,黄瑞红,等. 基于Labeled-LDA模型的文本分类新算法[C]// 全国信息检索与内容安全学术会议. 2007:620-627.
[9] 吕超镇,姬东鸿,吴飞飞. 基于LDA特征扩展的短文本分类[J]. 计算机工程与应用, 2015,51(4):123-127.
[10]陆彦婷,陆建峰,杨静宇. 层次分类方法综述[J]. 模式识别与人工智能, 2013,26(12):1130-1139.
[11]李保利. 基于类别层次结构的多层文本分类样本扩展策略[J]. 北京大学学报(自然科学版), 2015,51(2):357-366.
[12]袁路妍,顾国强,鲍世方. 多层文本分类器的研究及应用[J]. 计算机应用与软件, 2012,29(3):139-141.
[13]孔秋强,贺前华. 基于TFIDF与分类树的工程文本信息分类法[J]. 计算机应用与软件, 2014,31(6):174-176.
[14]李建林. 一种基于PCA的组合特征提取文本分类方法[J]. 计算机应用研究, 2013,30(8):2398-2401.
[15]王鹏,高铖,陈晓美. 基于LDA模型的文本聚类研究[J]. 情报科学, 2015,33(1):63-68.
[16]周建英,王飞跃,曾大军. 分层Dirichlet过程及其应用综述[J]. 自动化学报, 2011,37(4):389-407.
[17]张玉芳,万斌候,熊忠阳. 文本分类中的特征降维方法研究[J]. 计算机应用研究, 2012,29(7):2541-2543.
[18]王振振,何明,杜永萍. 基于LDA主题模型的文本相似度计算[J]. 计算机科学, 2013,40(12):229-232.
[19]Zhang Wen, Yoshida T, Tang Xijin. A comparative study of TF*IDF, LSI and multi-words for text classification[J]. Expert Systems with Applications, 2011,38(3):2758-2765.
[20]Chang C C, Lin C J. LIBSVM:A library for support vector machines[J]. ACM Trans. on Intelligent Systems and Technology, 2011,2(3):27-65. |