计算机与现代化 ›› 2015, Vol. 0 ›› Issue (8): 24-28.doi: 10.3969/j.issn.1006-2475.2015.08.005

• 应用与开发 • 上一篇    下一篇

基于主成分分析和Eros的邻近传播算法在金融数据集中的应用

  

  1. 中国民用航空飞行学院计算机学院,四川广汉618300
  • 收稿日期:2015-03-16 出版日期:2015-08-08 发布日期:2015-08-19
  • 作者简介:廖洪一(1989-),女,四川成都人,中国民用航空飞行学院计算机学院硕士研究生,研究方向:机器学习; 王欣(1973-),男,四川绵阳人,教授,研究生导师,博士,研究方向:数据挖掘。
  • 基金资助:
    国家自然科学基金民航联合基金资助项目(U1233105); 中国民用航空飞行学院大学生创新项目(201410624043)

Application of PCA and Eros Affinity Propagation Clustering in Financial Data Sets

  1. School of Computer Science, Civil Aviation Flight University of China, Guanghan 618300, China
  • Received:2015-03-16 Online:2015-08-08 Published:2015-08-19

摘要:

金融数据集的多维特性和高噪声特性使得对金融时间序列数据的分析难上加难,本文提出一种基于主成分分析和Eros的近邻传播的聚类算法。首先利用主成分分析方法对多变量的金融时间序
列数据进行降维处理,提取出主要特征值;然后使用基于Eros的近邻传播算法聚类对提取出的特征值进行分析。该聚类方法可以把数据集中的个体当作是原始数据的一个属性,通过迭代竞争达到最优,不
需要事先确定聚类数目。研究结果表明,这种集成算法大大降低了时间序列数据的维度,有很高的分类正确率,表明该聚类方法用于金融时间序列数据处理是有效可行的。

关键词: 近邻传播聚类, 弗罗贝尼乌斯范数; 多元时间序列, 主成分分析; 聚类模型

Abstract:

The multi-dimensional characteristics and high noise characteristics of the financial data set make it hard to analyze the time series. This paper puts forward an algorithm based on the principal component analysis and the Eros affinity propagation clustering. First it uses the principal component analysis method to extract the main eigenvalues of the multivariate financial time series data; then uses the Eros affinity propagation clustering to analyze the extracted eigenvalues. This kind of clustering algorithm can make the individual data as an attribute of the original data, through iterate competition to achieve optimal, do not need to find the number of clusters. The research results show that, this integrated method greatly reduces the dimension of the time series, and has a highly correct classification rate. It proves that this algorithm is very effective.

Key words: affinity propagation clustering, Frobenius norm, multivariate time series, principal component analysis, clustering model

中图分类号: