计算机与现代化

• 数据库与数据挖掘 • 上一篇    下一篇

基于改进贝叶斯网络的健康大数据分类模型

  

  1. (1.电子科技大学计算机科学与工程学院,四川成都611731;2.东莞成电金盘软件技术有限公司,广东东莞523808; 3.四川大学华西妇产儿童医院,四川成都610041;4.电子科技大学广东电子信息工程研究院,广东东莞523808)
  • 收稿日期:2017-04-18 出版日期:2017-12-25 发布日期:2017-12-26
  • 作者简介:梁聪(1992-),男,湖北孝感人,电子科技大学计算机科学与工程学院硕士研究生,研究方向:大数据分析,机器学习; 廖欣(1981-),女,四川成都人,四川大学华西妇产儿童医院病理科主诊医师,香港理工大学医疗技术系生物医学专业硕士,澳大利亚皇家墨尔本理工大学实验医学硕士,研究方向:妇产科临床病理诊断,人工智能在疾病诊断与病理分析中的应用。
  • 基金资助:
    广东省协同创新与平台环境建设专项资金资助项目(产学研合作项目)(2014A090906004)

A Healthy Big Data Classification Model Based on Improved Bayesian Network

  1. (1. School of Computer Science and Engineering, University of Electronic Science and Technology of China, Chengdu 611731, China;  2. Dongguan Chengdian Gold Plate Software Technology Co. Ltd., Dongguan 523808, China; 3. Huaxi Matenity and Child Hospital of Sichuan University, Chengdu 610041, China; 4. Guangdong Electronic Information Engineering Research Institute, University of Electronic Science and Technology of China, Dongguan 523808, China)
  • Received:2017-04-18 Online:2017-12-25 Published:2017-12-26

摘要: 贝叶斯网络是数据挖掘领域的研究热点,它是一种确定事物间不确定性依赖关系的有效工具。本文研究传统贝叶斯网络结构学习算法的优点和不足,并针对原算法的不足之处提出了改进。将改进后的算法应用于健康大数据集上,确定了数据集中各个健康属性之间的依赖关系,建立了相关属性依赖关系的网络结构。最终运用该网络结构对数据集中的数据进行自动分类。实验结果表明,本文基于贝叶斯网络建立的健康大数据分类模型具有良好的性能,实现了预期效果。

关键词: 健康大数据, 贝叶斯网络, 不确定性依赖, 分类模型

Abstract: Bayesian network is a research hotspot in the field of data mining. It is an effective tool for the determination of the uncertain dependencies. This paper studies the advantages and disadvantages of the traditional Bayesian network structure learning algorithm, and determines the dependencies among the various health attributes in the data set, establishes the network structure of dependency relation between related attributes. Finally, the network structure is used to automatically classify the data in the data set. Experiments show that the health big data classification model based on Bayesian network has a good performance and achieves the expected effect.

Key words: healthy big data, Bayesian network, uncertainty dependence, classification model

中图分类号: