出版日期:
2018-04-28
发布日期:
2018-05-02
作者简介:
邵锦炜(1991),男,广东云浮人,广东电网有限责任公司云浮供电局助理工程师,本科,研究方向:信息系统管理,项目管理; 林俊(1985),男,福建泉州人,广东电网有限责任公司信息中心工程师,硕士,研究方向:电气工程,项目管理,信息安全; 刘雅婷(1989),女,广东揭阳人,广东电网有限责任公司揭阳供电局助理工程师,本科,研究方向:信息系统管理,信息安全; 肖嘉丽(1980),女,广东广州人,广东电网有限责任公司高级经济师,硕士,研究方向:企业管理。
Online:
2018-04-28
Published:
2018-05-02
摘要: 数据库查询方法审计疑点发现依赖于审计人员先验知识,当经验不足且审计数据量巨大时,难以发挥大数据优势并从海量数据中发现疑点。为解决这一问题,提出基于改进Leaders算子迭代聚类的审计大数据潜在疑点发现方法。该方法在无先验知识的情形下,通过Leaders算法自动完成审计大数据的初始聚类,在此基础上通过随机抽样融合方法对初始聚类结果优化,最后通过多次迭代聚类的方法,对实例数较少或可疑程度易被掩盖的小簇进一步聚类,实现审计大 数据的精确聚类,并将实例较少且行为明显异常的数据聚类识别为潜在疑点,配合审计人员审计经验快速精确定位审计疑点。实验结果验证了算法的有效性,表明算法有助于从海量数据中自主发现审计疑点,缩小疑点筛查范围,提高审计效率。
中图分类号:
邵锦炜1,林 俊2,刘雅婷3,肖嘉丽4. 基于改进Leaders算子的审计潜在疑点发现[J]. 计算机与现代化, doi: 10.3969/j.issn.10062475.2018.04.015.
SHAO Jinwei1, LIN Jun2, LIU Yating3, XIAO Jiali4. Detection of Potential Audit Doubts Based on Improved Leaders Operator[J]. Computer and Modernization, doi: 10.3969/j.issn.10062475.2018.04.015.
[1] 程平,陈珊. 大数据时代基于DBSCAN聚类方法的审计抽样[J]. 中国注册会计师, 2016(4):7679. [2] 卢志茂,冯进玫,范冬梅,等. 面向大数据处理的划分聚类新方法[J]. 系统工程与电子技术, 2014,36(5):10101015. [3] 余晓东,雷英杰,岳韶华,等. 基于粒子群优化的直觉模糊核聚类算法研究[J]. 通信学报, 2015,36(5):7480. [4] 王会金. 中观信息系统审计风险控制体系研究——以COBIT框架与数据挖掘技术相结合为视角[J]. 审计与经济研究, 2012,27(1):1623. [5] 秦志光,王士雨,赵洋,等. 云存储服务的动态数据完整性审计方案[J]. 计算机研究与发展, 2015,52(10):21922199. [6] 秦荣生. 大数据、云计算技术对审计的影响研究[J]. 审计研究, 2014(6):2328. [7] 程平,范珂. 云会计环境下基于COBIT标准的“互联网+审计”模式研究[J]. 财务与会计, 2016(8):5961. [8] 〖JP3〗Ng R T, Han Jiawei. CLARANS: A method for clustering objects for spatial data mining[J]. IEEE Transactions on Knowledge and Data Engineering, 2002,14(5):10031016. [9] Guha S, Rastogi R, Shim K. CURE: An efficient clustering algorithm for large databases[J]. Information Systems, 2001,26(1):3558. [10]Vijaya P A, Murty M N, Subramanian D K. Leaderssubleaders: An efficient hierarchical clustering algorithm for large data sets[J]. Pattern Recognition Letters, 2004,25(4):505513. [11]Viswanath P, Babu V S. RoughDBSCAN: A fast hybrid density based clustering method for large data sets[J]. Pattern Recognition Letters, 2009,30(16):14771488. [12]杨蕴毅,孙中和,卢靖. 基于迭代式聚类的审计疑点发现——以上市公司财报数据为例[J]. 审计研究, 2015(4):6066. [13]张琼,张莹,白清源,等. 一种新的基于粗糙集的leader聚类算法[J]. 计算机科学, 2008,35(3):177179. [14]张燕平,张娟,何成刚,等. 基于佳点集与Leader方法的改进Kmeans聚类算法[J]. 计算机应用, 2011,31(5):13591362. [15]隋玉敏,孙秀芳,武优西,等. 负投影梯度的特征权重Leader聚类算法[J]. 小型微型计算机系统, 2014,35(9):21472150. [16]李斌,王劲松,黄玮. 一种大数据环境下的新聚类算法[J]. 计算机科学, 2015,42(12):247250. [17]HPC Lab. Frequent Set Counting[EB/OL]. http://miles.cnuce.cnr.it/~palmeri/datam/DCI/datasets.php, 20130824. |
[1] | 付鸿林, 张太红, 杨雅婷, 艾孜麦提·艾瓦尼尔, 马 博. 基于生成对抗网络的维语场景文字修改网络[J]. 计算机与现代化, 2024, 0(01): 41-46. |
[2] | 王秋忆, 周 浩, 郑婷婷. 改进RetinaNet的电力设备目标检测方法[J]. 计算机与现代化, 2024, 0(01): 47-52. |
[3] | 林启钊, 彭志平, 郭 棉, 崔得龙. 基于双向多步预测的炉管温度场重构方法[J]. 计算机与现代化, 2024, 0(01): 53-58. |
[4] | 郑立瑞, 肖晓霞, 邹北骥, 刘 彬, 周 展. 基于BERT的电子病历命名实体识别[J]. 计算机与现代化, 2024, 0(01): 87-91. |
[5] | 李颖颖, 黄文培. 基于优化八叉树的场景视锥体裁剪算法[J]. 计算机与现代化, 2024, 0(01): 103-108. |
[6] | 夏千涵, 何胜煌, 吴元清, 赵乐乐. 基于可学习记忆特征金字塔网络的小样本目标检测[J]. 计算机与现代化, 2023, 0(12): 7-13. |
[7] | 周成诚, 曾庆军, 杨 康, 胡家铭, 韩春伟. 基于高效通道注意力模块的运动想象脑电识别[J]. 计算机与现代化, 2023, 0(12): 19-23. |
[8] | 曾伟平, 陈俊洪, Muhammad ASIM, 刘文印, 杨振国. 基于多阶段分形组合的点云补全算法[J]. 计算机与现代化, 2023, 0(12): 24-29. |
[9] | 白晓波, 江梦茜, 王铁山, 邵景峰, 李 勃, . 聚类质心与指数递减方法改进的哈里斯鹰算法[J]. 计算机与现代化, 2023, 0(12): 30-35. |
[10] | 邱凯星, 冯 广. 基于双重特征注意力的多标签图像分类模型[J]. 计算机与现代化, 2023, 0(12): 41-47. |
[11] | 杜 康, 郭鲁钰, 徐啟蕾, 单宝明, 张方坤. 基于模型种群分析变量选择的红外光谱建模方法[J]. 计算机与现代化, 2023, 0(12): 48-52. |
[12] | 刘语珵, 贺 奇, 董延华, 王晓宇. 结合时间相关度与课程搭配度的课程推荐方法[J]. 计算机与现代化, 2023, 0(12): 53-58. |
[13] | 张浩洋, 尹梓名, 乐珺怡, 沈达聪, 束翌俊, 杨自逸, 孔祥勇, 龚 伟. 3D-SPRNet: 一种基于并行解码器和双注意力机制的胆囊癌分割模型[J]. 计算机与现代化, 2023, 0(12): 59-66. |
[14] | 张伯泉, 麦海鹏, 陈嘉敏, 逄锦聚. 基于高灰度值注意力机制的脑白质高信号分割[J]. 计算机与现代化, 2023, 0(12): 67-75. |
[15] | 张在成, 李 健. 改进的神经渲染方法在建筑施工场景中的应用[J]. 计算机与现代化, 2023, 0(12): 76-81. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||