Please wait a minute...

当期目录

    2022年 第0卷 第06期    刊出日期:2022-06-23
    算法设计与分析
    一种基于BERT和池化操作的文本分类模型
    张军, 邱龙龙
    2022, 0(06):  1-7. 
    摘要 ( 719 )   PDF (948KB) ( 132 )  
    参考文献 | 相关文章 | 计量指标
    使用预训练语言模型的微调方法在以文本分类为代表的许多自然语言处理任务中取得了良好的效果,尤其以基于Transformer框架的BERT模型为典型代表。然而,BERT直接使用[CLS]对应的向量作为文本表征,没有从全局和局部考虑文本的特征,从而限制了模型的分类性能。因此,本文提出一种引入池化操作的文本分类模型,使用平均池化、最大池化以及K-MaxPooling等池化方法从BERT输出矩阵中提取文本的表征向量。实验结果表明,与原始的BERT模型相比,本文提出的引入池化操作的文本分类模型具有更好的性能,在实验的所有文本分类任务中,其准确率和F1-Score值均优于BERT模型。
    基于PSO-KPLS的教师科研绩效预测
    黄玲, 白晓波
    2022, 0(06):  8-12. 
    摘要 ( 175 )   PDF (984KB) ( 76 )  
    参考文献 | 相关文章 | 计量指标
    为了解决高校教师科研绩效难以预测的问题,首先,建立模型的优化目标,提出PSO-KPLS算法,其基本思想是:利用粒子群(Particle Swarm Optimization, PSO)算法作为寻优算法和均方根误差(RMSE)作为收敛判据,对核偏最小二乘法(Kernel-based Partial Least-Squares, KPLS)的参数进行群体寻优,以代替手动调参的寻优过程。然后,利用多维度的特征向量来表达教师的科研绩效,并利用综合法计算其科研分值。最后,以学院60个教师近6年的数据作为样本,利用PSO-KPLS训练模型并对模型进行拟合,并重点探究精度要求对PSO-KPLS运行效率的影响。通过和其他优化的KPLS算法的对比实验,结果表明:利用PSO-KPLS能够准确地预测老师在未来2~3年的科研绩效。
    基于混合策略改进的鲸鱼优化算法
    李茹, 范冰冰
    2022, 0(06):  13-20. 
    摘要 ( 489 )   PDF (1185KB) ( 121 )  
    参考文献 | 相关文章 | 计量指标
    针对原始鲸鱼优化算法(WOA)收敛速度慢、全局搜索能力弱、求解精度低且易陷入局部最优等问题,提出一种混合策略来改进的鲸鱼优化算法(LGWOA)。首先将莱维飞行引入鲸鱼全局搜索的公式中,通过莱维飞行加大全局搜索步长,扩大搜索空间、提高全局搜索能力;其次,在鲸鱼螺旋上升阶段,加入一个自适应权重参数来提高算法的局部搜索能力和求解精度;最后结合遗传算法的交叉变异思想平衡算法的全局搜索和局部搜索能力,维持种群的多样性,规避陷入局部最优。通过对12个基准测试函数从2个角度进行实验对比分析,结果表明,基于混合策略改进的鲸鱼优化算法在收敛速度和求解精度上均有明显提升。
    融合RoBERTa和特征提取的政务热线工单分类
    陈钢
    2022, 0(06):  21-26. 
    摘要 ( 262 )   PDF (1297KB) ( 105 )  
    参考文献 | 相关文章 | 计量指标
    政务热线承接了海量市民诉求,人工对工单分类耗时费力。现有工单分类方法大多基于机器学习或单一神经网络模型,难以有效理解上下文语义信息,且文本特征提取不全面。针对这一问题,本文提出一种融合RoBERTa和特征提取的政务热线工单分类方法。该方法首先通过基于RoBERTa预训练语言模型的语义编码层获取政务热线工单文本中的语义表征向量,然后通过由CNN-BiGRU-Self-Attention定义的特征提取层获取工单文本的局部特征和全局特征,并对全局特征进行处理以凸显重要性高的语义特征,最后将融合后的特征向量输入分类器来完成工单分类。实验结果表明,相较于其他基线分类方法,本文提出的方法能够取得更好的工单分类效果。
    一种基于信息测度的多属性决策方法
    魏丽君, 吴海波, 章若冰
    2022, 0(06):  27-31. 
    摘要 ( 163 )   PDF (626KB) ( 115 )  
    参考文献 | 相关文章 | 计量指标
    单值中智集(SVN)可以用来表示现实情况中存在的不确定性和不一致信息。信息测度在支持向量网络理论中占有重要地位,近年来受到越来越多的关注。本文提出一种基于单值中智信息测度的多属性决策方法。首先介绍信息度量的3个公理化定义,其中包括熵、相似性测度和交叉熵。然后,基于余弦函数构造信息测度公式,进一步讨论熵、相似测度和交叉熵之间的关系及其相互转换。在此基础上,提出一种基于信息测度公式的单值中智集多属性决策方法。最后,给出城市污染评价的数值实例,论证该方法的适用性和有效性。
    数据库与数据挖掘
    《平凡的世界》人物关系网络分析
    王君, 何进荣, 马乐荣
    2022, 0(06):  32-36. 
    摘要 ( 439 )   PDF (1405KB) ( 110 )  
    参考文献 | 相关文章 | 计量指标
    文学作品中人物关系网络的构建与定量分析是文学作品智能化解读的重要内容。本文以路遥先生文学作品《平凡的世界》为研究对象,利用复杂网络分析方法,对文学作品中的社交网络进行构建和分析。首先提取作品中的社交网络关系,其中小说人物对应社交网络中的节点,人物之间的关系对应社交网络的边,各章人物共同出现次数对应于边的权重,然后对构建的网络进行介数、集聚系数相关性等网络指标分析及分层聚类和链路预测。实验结果表明《平凡的世界》作品中的人物关系网络是异配网络并具有小世界特性。该研究有助于推动文学作品中人物关系网络的分析。
    融合用户历史传播信息的微博谣言检测
    卢悦, 曹春萍
    2022, 0(06):  37-42. 
    摘要 ( 193 )   PDF (1203KB) ( 102 )  
    参考文献 | 相关文章 | 计量指标
    随着互联网技术的发展,以微博为主的社交媒体平台上网络谣言逐渐泛滥,研究微博谣言的自动检测对维护社会稳定具有重要意义。现今主流的基于深度学习的谣言检测方法普遍存在没有充分考虑微博文本语义信息的问题,同时,过分依赖传播信息的谣言检测方法使得检测时间滞后,不能满足谣言检测的现实需求。针对以上问题,本文提出一种融合用户历史交互信息的微博谣言检测模型,不使用待检测微博的传播信息,构建并训练AbaNet(ALBERT-BiGRU-Attention)深度学习网络模型,充分考虑待检测微博和用户历史传播信息文本的文本特征和语义信息进行谣言检测。实验结果显示,本文模型具有准确率高、稳定性强的特点,并且能够在获得较高检测精度的情况下大大缩短谣言检测的时间。
    C2C在线短租跨平台房东匹配算法
    吴代漾, 赵洁, 梁家铭, 董振宁, 梁周扬
    2022, 0(06):  43-48. 
    摘要 ( 126 )   PDF (1419KB) ( 101 )  
    参考文献 | 相关文章 | 计量指标
    随着民宿与在线短租平台的兴起,房东多归属现象持续受到关注与研究,该现象提供了新的研究角度,而如何在不同平台识别同源房东成为首要解决的问题。故本文基于传统用户匹配探索C2C在线短租跨平台房东匹配算法。其中由于房东个人信息稀疏,因此本文引入房源信息,设计基于房源信息的两阶段房东匹配算法(TSHM)。本文方法在基于国内2大在线短租平台真实数据划分的普通数据集与难例数据集上分别达到99.69%与81.97%的准确率,优于SVM、DT等传统分类器,验证了匹配模型与匹配特征的有效性,为跨平台房东匹配提供新思路,在房东个人信息缺乏条件下仍可有效匹配房东。但本文仅针对国内平台数据进行实验,未引入文本与图片等特征,存在一定局限性。
    气象高性能计算环境中模式协同研发管理
    赵春燕, 孙婧, 胡江凯, 周斌
    2022, 0(06):  49-55. 
    摘要 ( 146 )   PDF (1683KB) ( 87 )  
    参考文献 | 相关文章 | 计量指标
    面向气象科学的数值预报模式的研发过程是一个多学科交叉、持续改进型的复杂系统工程。在地球系统模式、E级计算和后摩尔时代的发展趋势下,气象数值模式研发协同面临更复杂的协同、更专业的计算平台调试分析、更广泛的共享应用等挑战。从以上需求和挑战出发,在气象高性能计算环境中,采用Git分布式技术、Python及工作流技术,建设气象数值模式研发协同管理支撑环境和标准,实现模式协同研发过程的管理、成果的集成共享和研发调试试验及分析一体化的支撑,以提升模式研发协同效率和业务化效率,保障研发成果的完整性和可跟踪性,提升大规模科学软件研发的管理能力。应用效果表明,本研究规范化了模式研发的协同过程,并建立流畅的协同支撑环境,提升模式迭代升级和业务化效率,能够为科学研究、科学计算等大型传统科学计算模型的持续研发改进管理及软件工程协同管理提供借鉴。
    人工智能
    文本摘要模型的研究进展
    张紫芸, 王文发, 马乐荣, 丁苍峰
    2022, 0(06):  56-66. 
    摘要 ( 248 )   PDF (1415KB) ( 121 )  
    参考文献 | 相关文章 | 计量指标
    随着互联网产生的文本数据越来越多,文本信息过载问题日益严重,对各类文本进行一个“降维”处理显得非常必要,文本摘要便是其中一个重要的手段,也是人工智能领域研究的热点和难点之一。文本摘要旨在将文本或文本集合转换为包含关键信息的简短摘要。近年来语言模型的预处理提高了许多自然语言处理任务的技术水平,包括情感分析、问答、自然语言推理、命名实体识别和文本相似性、文本摘要。本文梳理文本摘要以往的经典方法和近几年的基于预训练的文本摘要方法,并对文本摘要的数据集以及评价方法进行整理,最后总结文本摘要目前面临的挑战与发展趋势。
    基于深度学习的驾驶员分心行为识别
    何丽雯, 张锐驰
    2022, 0(06):  67-74. 
    摘要 ( 339 )   PDF (2347KB) ( 109 )  
    参考文献 | 相关文章 | 计量指标
    分心驾驶行为识别是提高驾驶安全的主要方法之一。针对分心驾驶行为识别精度低的问题,本文提出一种基于深度学习的驾驶员分心行为识别算法,由目标检测网络和行为精确识别网络级联构成。基于State Farm公开数据集,第一级利用目标检测算法SSD(Single Shot Multibox Detector)对数据集中的驾驶员原始图像进行局部信息提取,确定行为识别候选区域;第二级分别利用迁移学习VGG19、ResNet50和MobileNetV2模型对候选区域内的行为信息进行精确识别;最后,实验对比级联架构与单模型架构对分心驾驶行为的识别精度。结果表明,提出的级联网络模型相较于主流单模型检测方法,驾驶员行为识别的准确率总体上提升4~7%个百分点。该算法不仅减少噪声和其他背景区域对模型的影响,提高分心行为识别准确率,还可以有效识别更多的行为类别以避免动作的误分类。
    基于改进深度神经网络的心血管疾病预测
    刘玉航1, 曲媛1, 徐英豪1, 朱习军1, 于岩
    2022, 0(06):  75-79. 
    摘要 ( 159 )   PDF (969KB) ( 106 )  
    参考文献 | 相关文章 | 计量指标
    心血管疾病是威胁人类健康的常见疾病,为了能够更加准确地对其预测,本文在传统DNN模型基础上进行优化改进,提出定向正则的深度神经网络(TR-DNN)模型,通过改进原有深度神经网络模型所存在的缺陷,使其能够更好地对心血管疾病数据集进行训练并测试,进一步实现心血管疾病预测任务。实验表明该模型在数据集训练上的表现良好,并且在测试集上取得优秀的结果。最后,将TR-DNN与SVM、RF、XGBoost模型在同一数据集进行结果比较,TR-DNN模型的各项评价指标均优于其它模型,在准确率方面相较传统DNN模型提高1.507个百分点,召回率提高1.57个百分点,特异度提高2.54个百分点,精确率提高1.51个百分点。因此,TR-DNN模型可以应用于心血管疾病的预测。
    数据驱动的RF信号深度调制识别方法
    徐亚军, 郭恩豪, 陈 林, 司成可
    2022, 0(06):  80-86. 
    摘要 ( 112 )   PDF (2427KB) ( 85 )  
    参考文献 | 相关文章 | 计量指标
    基于卷积结构的信号调制识别神经网络的识别性能受信号调制类型种类限制。例如,在12 dB信噪比条件下,同时对24种信号调制类型进行识别,其识别准确率仅为80%。若需要进一步提高识别性能,则要求更复杂的网络模型,导致网络训练所需数据集规模和硬件资源成本增大。鉴于此,针对无线电信号特征,设计一种适用于无线电信号调制识别的紧致残差神经网络,将其作为信号调制类型特征学习和特征提取工具,实现从原始I、Q数据到信号调制类型的端到端识别。利用迁移学习降低网络重新训练所需样本数,增强在无线信道响应发生变化时的环境适应能力,降低训练阶段所需的硬件资源和训练数据集规模。研究表明,当信道脉冲响应改变时,所提的信号调制识别神经网络在信噪比为12 dB条件下的识别性能达到95%,多个对比实验验证本文所设计神经网络的识别性能具有优势。
    图像处理
    计算机视觉下的果实目标检测算法综述
    李伟强, 王东, 宁政通, 卢明亮, 覃鹏飞
    2022, 0(06):  87-95. 
    摘要 ( 379 )   PDF (1939KB) ( 138 )  
    参考文献 | 相关文章 | 计量指标
    基于计算机视觉的果实目标检测识别是目标检测、计算机视觉、农业机器人等多学科的重要交叉研究课题,在智慧农业、农业现代化、自动采摘机器人等领域,具有重要的理论研究意义和实际应用价值。随着深度学习在图像处理领域中广泛应用并取得良好效果,计算机视觉技术结合深度学习方法的果实目标检测识别算法逐渐成为主流。本文介绍基于计算机视觉的果实目标检测识别的任务、难点和发展现状,以及2类基于深度学习方法的果实目标检测识别算法,最后介绍用于算法模型训练学习的公开数据集与评价模型性能的评价指标,且对当前果实目标检测识别存在的问题和未来可能的发展方向进行讨论。
    面向变电站监控界面自动测试的画面识别算法
    赵娜, 刘文彪, 王连涛, 王梦如, 任振兴
    2022, 0(06):  96-103. 
    摘要 ( 169 )   PDF (3136KB) ( 93 )  
    参考文献 | 相关文章 | 计量指标
    对变电站监控系统人机界面进行测试验证时,通常采用对比人眼观察到的监控画面与测试指令发送的信息是否一致的方式评估监控软件是否达标,而人眼观察繁杂多变,监控信息的准确率和效率均得不到保证。为了实现变电站监控的自动测试,研究利用图像处理和机器学习技术识别变电站监控画面信息的方法。提出一种基于最佳图元的模板匹配方法解决画面中不同尺寸电气图元的自动定位问题;针对监控画面中拓扑特点提出FHOG算子并提高监控画面和图元状态的识别速度;针对汉字左右体结构分离和告警信息画面中的字符粘连等问题,提出分割识别协同的算法定位字符,并使用深度卷积神经网络进行识别。经线下实验验证了各个单元算法在实际变电站监控图像上的有效性。设计一套测试系统,经线上测试总体图元识别准确率达到96.04%。
    基于改进YOLOv5的安全帽佩戴检测
    岳衡, 黄晓明, 林明辉, 高明, 李扬, 陈凌
    2022, 0(06):  104-108. 
    摘要 ( 432 )   PDF (2508KB) ( 140 )  
    参考文献 | 相关文章 | 计量指标
    针对YOLOv5无法通过权重进行聚焦,产生更具有分辨性的特征,从而降低安全帽检测准确性的问题,使用注意力模块,并分别研究压缩激励层(Squeeze and Excitation Layer, SEL)和高效通道注意力(Efficient Channel Attention, ECA)模块。针对YOLOv5去除冗余框时采用的非极大值抑制(Non Maximum Suppression, NMS)在物体高度重叠时仅保留同类最高置信度预测框的问题,使用Soft-NMS算法保留更多的预测框,并进一步使用加权非极大值抑制(Weighted Non Maximum Suppression, WNMS)融合多次预测框信息提升预测框准确性;针对下采样带来的信息丢失问题,使用Focus模块提升检测效果;综合各个模块得到最优的FESW-YOLO算法。该算法在安全帽数据集上的mAP@0.5、mAP@0.5:0.95相较于YOLOv5分别提高了2.1个百分点、1.2个百分点,提升了安全帽监管准确性。
    基于软硬件协同加速框架的遥感图像目标检测
    谭金林, 范文童, 刘亚虎, 梁志锋, 王梁, 刘斌, 黄斌
    2022, 0(06):  109-115. 
    摘要 ( 178 )   PDF (2195KB) ( 101 )  
    参考文献 | 相关文章 | 计量指标
    由于遥感图像目标检测模型计算复杂度和内存需求的急剧增加,难以应用在小尺寸和低功耗的嵌入式平台上。针对上述问题,本文提出一种基于现场可编程门阵列(Field-Programmable Gate Array, FPGA)的软硬件协同加速框架,实现遥感图像目标检测模型的推理加速。首先,遵循Vitis AI加速方案对训练后的YOLOv3网络参数进行压缩、编译;其次,在FPGA端搭建包含深度学习处理单元(Deep-Learning Processing Unit, DPU)模块的底层硬件工程,并在ARM上编写DPU任务调度程序;最后,在Zynq SoC开发平台上实现FPGA的推理加速。实验结果表明,该框架在Xilinx-Zynq-MPSoC上的平均吞吐率为1.75 TOPs(26.8 fps),并且在DIOR数据集上的平均精度(mean Average Precision, mAP)为56.7%。
    信息安全
    基于空时特征融合和注意力机制的网络入侵检测模型
    饶海兵, 朱苏磊, 杨春夏
    2022, 0(06):  116-121. 
    摘要 ( 212 )   PDF (6398KB) ( 91 )  
    参考文献 | 相关文章 | 计量指标
    针对网络入侵检测性能不高的问题,提出一种基于空时特征融合和注意力机制的深度学习入侵检测模型CTA-net。该模型通过集成卷积神经网络(CNN)和长短时记忆网络(LSTM)获取空时融合特征,然后使用注意力模块(Attention)对输入的空时融合特征进行重要性加权计算,最后通过softmax函数进行分类。使用NSL-KDD数据集的实验结果表明,相比具有相似结构的CNN模型和空时融合的CNN-LSTM模型,在训练集的收敛性具有显著的提升,在测试集上使用的分类评价指标准确率分别提升10.9120个百分点和11.8740个百分点,精确率分别提升9.1950个百分点和9.6130个百分点,召回率分别提升9.1780个百分点和9.9340个百分点,F1-SCORE分别提升10.7830个百分点和11.7500个百分点。仿真结果表明,所提出的CTA-net模型在网络入侵检测方面具有较好的应用潜力。
    一种基于改进TF-IDF的SQL注入攻击检测算法
    关慧, 盛靖媛, 曹同洲
    2022, 0(06):  122-126. 
    摘要 ( 211 )   PDF (673KB) ( 97 )  
    参考文献 | 相关文章 | 计量指标
    由于传统的TF-IDF算法没有很好地分配特征词的权重,从而会出现特征提取不充分并且效率低等问题,导致结果不符合实际情况。为了解决该方法在SQL注入攻击检测时所产生的局限性,本文通过在传统的TF-IDF算法里面加入文本数量比因子和卡方统计量CHI来改进TF-IDF,能够很好地改善一些重要词汇的权重问题。通过选择不同的分类器实现SQL注入攻击的检测,从而获得不同的分类结果。实验结果表明,Boosted Decision Tree和改进的TF-IDF相结合的方法与其它同类方法相比,具有更高的准确率、召回率和F1值。此外,本文算法相较于传统的TF-IDF算法对SQL注入攻击检测的正确率、准确率、召回率、F1值均提高5%左右,具有一定的实际应用前景。