计算机与现代化

• 数据库与数据挖掘 • 上一篇    下一篇

基于相关反馈的时间序列相似性搜索

  

  1. (河海大学计算机与信息学院,江苏南京211100)
  • 收稿日期:2017-06-22 出版日期:2018-03-08 发布日期:2018-03-09
  • 作者简介:刘琪(1992-),女,江苏南京人,河海大学计算机与信息学院硕士研究生,研究方向:数据挖掘; 张鹏程(1981-),男,江苏滨海人,副教授,CCF 高级会员,博士,研究方向:软件工程,数据分析与处理; 王继民(1976-),男,安徽全椒人,副教授,硕士,研究方向:数据挖掘,智能信息处理。
  • 基金资助:
    国家科技支撑计划资助项目(2015BAB07B01); 国家自然科学基金资助项目(61572171)

Time Series Similarity Search Based on Relevance Feedback

  1. (College of Computer and Information, Hohai University, Nanjing 211100, China)
  • Received:2017-06-22 Online:2018-03-08 Published:2018-03-09

摘要: 传统的基于相关反馈的时间序列相似性搜索是将正反馈和负反馈融合在一起创建新查询向量,这样并没有充分利用负反馈序列的价值,而且容易对初始查询向量进行过多的更改。本文提出一种基于反馈的时间序列相似搜索方法,将反馈的正相关和负相关序列分开处理,最终的相似序列不但要与正相关序列相似,还要尽量与负相关序列不相似。在UCR数据集上的实验结果表明,本文提出的相似搜索方法与传统的基于反馈的相似搜索方法相比,在某些数据集上可以提高查询的准确率以及查全率。

关键词: 数据挖据, 时间序列, 相似性搜索, 相关反馈

Abstract: The traditional time series similarity search based on relevance feedback is to combine positive feedback with negative feedback to create new query vectors. This does not make full use of the value of negative feedback sequence, and it is easy to make too many changes to the initial query vector. This paper proposes a similar time series search method based on relevance feedback. The positive relevance feedback and negative relevance feedback are carried out separately. This way makes the results far away from negative relevant sequence. The results of similarity search on UCR data sets show that the similarity search method based on relevance feedback can improve the accuracy of similarity query.

Key words: data mining, time series, similarity search, relevance feedback

中图分类号: