计算机与现代化

• 数据库与数据挖掘 • 上一篇    下一篇

基于时空相关性的连续缺失值填补算法

  

  1. (河海大学计算机与信息学院,江苏南京211100)
  • 收稿日期:2016-03-10 出版日期:2016-09-12 发布日期:2016-09-13
  • 作者简介:蒋晨阳(1991-),女,江苏如东人,河海大学计算机与信息学院硕士研究生,研究方向:数据挖掘; 张云飞(1980-),男,讲师,博士,研究方向:数据挖掘,知识工程; 李鑫(1992-),男,硕士研究生,研究方向:数据挖掘。
  • 基金资助:
    国家科技支撑计划资助项目(2013BAB05B01)

Imputation Algorithm of Continuous Missing Values Based on Temporal and Spatial Correlation

  1. (College of Computer and Information, Hohai University, Nanjing 211100, China)
  • Received:2016-03-10 Online:2016-09-12 Published:2016-09-13

摘要: 无线传感器网络中的缺失数据对后续的数据分析带来很多不利影响,在数据分析之前,预处理工作必不可少。传感器网络数据在时间和空间方面均存在一定的变化规律,现有的缺失值填补算法往往只从单一角度分析解决问题,为了充分利用时空2个维度的特性,本文提出一种基于时空相关性的缺失值填补方法。该方法运用回归拟合、改进的BP神经网络等方法,对缺失数据进行填补。实验结果表明,该方法可以有效地提升缺失值填补的精度。

关键词: 时空相关性, 缺失值, 传感器网络, BP神经网络

Abstract: On wireless sensor network, the missing data causes many difficulties in data analysis. Prior to data analysis, data preprocessing is necessary. Sensor network data has some change rules both in time and space. Existing imputation algorithms of missing values solve the problems only from a single point of view. In this paper, a imputation algorithm of missing values based on temporal and spatial correlation is proposed in order to make full use of the characteristics of space and time. It adopts regression model and improves BP neural network to estimate the missing values. Experiments show that this method can improve the imputation accuracy of missing values effectively.

Key words:  temporal and spatial correlation, missing values, sensor network, BP neural network

中图分类号: