计算机与现代化 ›› 2018, Vol. 0 ›› Issue (04): 79-.doi: 10.3969/j.issn.10062475.2018.04.015
出版日期:
2018-04-28
发布日期:
2018-05-02
作者简介:
邵锦炜(1991),男,广东云浮人,广东电网有限责任公司云浮供电局助理工程师,本科,研究方向:信息系统管理,项目管理; 林俊(1985),男,福建泉州人,广东电网有限责任公司信息中心工程师,硕士,研究方向:电气工程,项目管理,信息安全; 刘雅婷(1989),女,广东揭阳人,广东电网有限责任公司揭阳供电局助理工程师,本科,研究方向:信息系统管理,信息安全; 肖嘉丽(1980),女,广东广州人,广东电网有限责任公司高级经济师,硕士,研究方向:企业管理。
Online:
2018-04-28
Published:
2018-05-02
摘要: 数据库查询方法审计疑点发现依赖于审计人员先验知识,当经验不足且审计数据量巨大时,难以发挥大数据优势并从海量数据中发现疑点。为解决这一问题,提出基于改进Leaders算子迭代聚类的审计大数据潜在疑点发现方法。该方法在无先验知识的情形下,通过Leaders算法自动完成审计大数据的初始聚类,在此基础上通过随机抽样融合方法对初始聚类结果优化,最后通过多次迭代聚类的方法,对实例数较少或可疑程度易被掩盖的小簇进一步聚类,实现审计大 数据的精确聚类,并将实例较少且行为明显异常的数据聚类识别为潜在疑点,配合审计人员审计经验快速精确定位审计疑点。实验结果验证了算法的有效性,表明算法有助于从海量数据中自主发现审计疑点,缩小疑点筛查范围,提高审计效率。
中图分类号:
邵锦炜1,林 俊2,刘雅婷3,肖嘉丽4. 基于改进Leaders算子的审计潜在疑点发现[J]. 计算机与现代化, 2018, 0(04): 79-.
SHAO Jinwei1, LIN Jun2, LIU Yating3, XIAO Jiali4. Detection of Potential Audit Doubts Based on Improved Leaders Operator[J]. Computer and Modernization, 2018, 0(04): 79-.
[1] 程平,陈珊. 大数据时代基于DBSCAN聚类方法的审计抽样[J]. 中国注册会计师, 2016(4):7679. [2] 卢志茂,冯进玫,范冬梅,等. 面向大数据处理的划分聚类新方法[J]. 系统工程与电子技术, 2014,36(5):10101015. [3] 余晓东,雷英杰,岳韶华,等. 基于粒子群优化的直觉模糊核聚类算法研究[J]. 通信学报, 2015,36(5):7480. [4] 王会金. 中观信息系统审计风险控制体系研究——以COBIT框架与数据挖掘技术相结合为视角[J]. 审计与经济研究, 2012,27(1):1623. [5] 秦志光,王士雨,赵洋,等. 云存储服务的动态数据完整性审计方案[J]. 计算机研究与发展, 2015,52(10):21922199. [6] 秦荣生. 大数据、云计算技术对审计的影响研究[J]. 审计研究, 2014(6):2328. [7] 程平,范珂. 云会计环境下基于COBIT标准的“互联网+审计”模式研究[J]. 财务与会计, 2016(8):5961. [8] 〖JP3〗Ng R T, Han Jiawei. CLARANS: A method for clustering objects for spatial data mining[J]. IEEE Transactions on Knowledge and Data Engineering, 2002,14(5):10031016. [9] Guha S, Rastogi R, Shim K. CURE: An efficient clustering algorithm for large databases[J]. Information Systems, 2001,26(1):3558. [10]Vijaya P A, Murty M N, Subramanian D K. Leaderssubleaders: An efficient hierarchical clustering algorithm for large data sets[J]. Pattern Recognition Letters, 2004,25(4):505513. [11]Viswanath P, Babu V S. RoughDBSCAN: A fast hybrid density based clustering method for large data sets[J]. Pattern Recognition Letters, 2009,30(16):14771488. [12]杨蕴毅,孙中和,卢靖. 基于迭代式聚类的审计疑点发现——以上市公司财报数据为例[J]. 审计研究, 2015(4):6066. [13]张琼,张莹,白清源,等. 一种新的基于粗糙集的leader聚类算法[J]. 计算机科学, 2008,35(3):177179. [14]张燕平,张娟,何成刚,等. 基于佳点集与Leader方法的改进Kmeans聚类算法[J]. 计算机应用, 2011,31(5):13591362. [15]隋玉敏,孙秀芳,武优西,等. 负投影梯度的特征权重Leader聚类算法[J]. 小型微型计算机系统, 2014,35(9):21472150. [16]李斌,王劲松,黄玮. 一种大数据环境下的新聚类算法[J]. 计算机科学, 2015,42(12):247250. [17]HPC Lab. Frequent Set Counting[EB/OL]. http://miles.cnuce.cnr.it/~palmeri/datam/DCI/datasets.php, 20130824. |
[1] | 何思达, 陈平华. 基于意图的轻量级自注意力序列推荐模型[J]. 计算机与现代化, 2024, 0(12): 1-9. |
[2] | 郑久超, 赵新元. 基于主题与描述信息的实体链接方法[J]. 计算机与现代化, 2024, 0(12): 10-14. |
[3] | 赵晨阳, 薛涛, 刘俊华. 基于改进Stable Diffusion的时尚服饰图案生成[J]. 计算机与现代化, 2024, 0(12): 15-23. |
[4] | 黄庭培1, 马禄彪1, 李世宝2, 刘建航1. 基于WiFi和原型网络的手势识别方法[J]. 计算机与现代化, 2024, 0(12): 34-39. |
[5] | 刘云海1, 冯广1, 吴晓婷2, 杨群2. 复杂施工场景下的安全帽佩戴检测算法[J]. 计算机与现代化, 2024, 0(12): 66-71. |
[6] | 王艳媛, 茅正冲. 中英文场景文本图像的检测和识别算法[J]. 计算机与现代化, 2024, 0(12): 84-90. |
[7] | 张昆1, 张永伟1, 吴永城1, 张笑文2, 翟世臣2. 基于大模型的设备故障知识图谱自动构建方法[J]. 计算机与现代化, 2024, 0(11): 46-53. |
[8] | 张志霞, 秦志毅. 基于变分模态分解和IGJO-SVR的网络舆情预测[J]. 计算机与现代化, 2024, 0(11): 77-83. |
[9] | 万鸿炜, 陈平华. 基于Involution算子和协调反向注意力的息肉图像分割[J]. 计算机与现代化, 2024, 0(11): 84-90. |
[10] | 张宇1, 2, 黎靖1, 2, 马铭1, 2, 王众祥1, 2, 孙妍1, 2. YOLOLW:一个新的轻量级目标检测模型[J]. 计算机与现代化, 2024, 0(11): 91-98. |
[11] | 董玉玟. 基于改进YOLOv7-tiny的多尺度运动目标检测算法[J]. 计算机与现代化, 2024, 0(11): 99-105. |
[12] | 祁贤, 刘大铭, 常佳鑫. 基于改进自注意力机制的多视图三维重建[J]. 计算机与现代化, 2024, 0(11): 106-112. |
[13] | 陈凯1, 李宜汀1, 2, 全华凤1 . 基于改进YOLOv8的河道废弃瓶检测方法[J]. 计算机与现代化, 2024, 0(11): 113-120. |
[14] | 杨庆五, 罗小辉, 刘鑫. 基于Edge Drawing的工业图像圆检测算法[J]. 计算机与现代化, 2024, 0(11): 121-126. |
[15] | 周安达, 唐超颖. 雨天道路场景语义分割算法及其移动端部署[J]. 计算机与现代化, 2024, 0(10): 7-13. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||