计算机与现代化

华昕宇, 祁云嵩

2023, 0(05): 1-7.

摘要 ( 515 )

PDF (1818KB) ( 104 )

参考文献 | 相关文章 | 计量指标

为进一步提高脑肿瘤影像诊断的准确性和稳健性，提出一种基于CBAM（Convolutional Block Attention Module）和改进通道注意力机制的EfficientNet神经网络（IC+IEffxNet）的新型混合脑肿瘤分类方法。该方法分为2个阶段，第一阶段由基于改进空间注意力机制的CBAM模型提取特征。第二阶段将EfficientNet架构中的Squeeze and Excitation（SE）块替换成Efficient Channel Attention （ECA）块，将第一阶段的组合特征输出作为第二阶段的输入。实验展示了在混合脑肿瘤MRI数据集下，神经胶质瘤患者、脑膜瘤患者、脑垂体瘤患者与正常患者图像的4分类结果，实验结果显示分类平均准确率比现有方法提高约0.5~2个百分点。实验结果证明了该方法的有效性，为医疗专家能够准确判断脑肿瘤种类提供了新的参考。

基于通道注意力和Transformer的图像标题生成方法

刘静, 陈金广

2023, 0(05): 8-12.

摘要 ( 276 )

PDF (10305KB) ( 80 )

参考文献 | 相关文章 | 计量指标

图像标题生成是指通过计算机将图像翻译成描述该图像的标题语句。针对现有图像标题生成任务中，未充分利用图像的局部和全局特征以及时间复杂度较高的问题，本文提出一种基于卷积神经网络（Convolution Neural Networks， CNN）和Transformer的混合结构图像标题生成模型。考虑卷积网络所具有的空间和通道特性，首先将轻量化高精度的注意力ECA与卷积网络CNN进行融合构成注意力残差块，用于从输入图像中提取视觉特征；然后将特征输入到序列模型Transformer中，在编码器端借助自注意学习来获得所参与的视觉表示，在语言解码器中捕获标题中的细粒度信息以及学习标题序列间的相互作用，进而结合视觉特征逐步得到图像所对应的标题描述。将模型在MSCOCO数据集上进行实验，BLEU-1、BLEU-3、BLEU-4、Meteor和CIDEr指标分别提高了0.3、0.5、0.7、0.4、1.6个百分点。

基于小样本学习的藏文命名实体识别

于韬, 张英, 拥措,

2023, 0(05): 13-19.

摘要 ( 249 )

PDF (1601KB) ( 59 )

参考文献 | 相关文章 | 计量指标

藏文命名实体识别是藏文自然语言处理领域的一项关键技术，其目的是识别文本中的人名、地名及组织机构名。在目前的研究中，深度学习方法需要大量的标注数据是制约模型性能的主要因素，因此本文提出基于小样本学习的藏文命名实体识别方法。针对小样本数据量少导致模型无法充分学习实体特征的问题，本文提出实体特征信息融合方法，在训练过程中将实体位置信息、分词信息与藏文音节信息以维度拼接的方式进行特征融合，通过辅助信息增强实体特征，使得模型可以较好地学习藏文长实体的边界信息，并设计消融实验探究不同特征信息对模型效果的影响。实验结果表明，本文提出的方法有效提高了藏文小样本命名实体识别模型的准确率，相较于基线实验F1值总体提升了22.22~38个百分点。

基于Logistic-GF-SEIR模型的新型传染病疫情趋势预测

吴乐, 陈刚, 李竹

2023, 0(05): 20-25.

摘要 ( 226 )

PDF (14136KB) ( 58 )

参考文献 | 相关文章 | 计量指标

为了提高新型传染病疫情趋势的预测精度，本文对传统SEIR模型进行改进，提出Logistic-GF-SEIR模型。首先，基于历史数据使用Logistic模型拟合累计康复者，并反演每日康复率、感染率和接触率；其次，使用高斯模型和Logistic模型拟合出最优时变参数；最后，初始化模型初值预测疫情群体变化趋势。以新冠肺炎爆发初期武汉市和日本的疫情发展趋势为例进行仿真测试，并与Logistic、SEIR、ARIMA、BP神经网络等预测模型进行对比分析。结果表明Logistic-GF-SEIR模型在武汉市疫情的预测中拟合和预测性能均优于其他模型，在日本疫情的预测中均方根误差优于其他模型，验证了所提出模型的可行性、有效性及稳健性，可为我国制定相似传染病的防控政策提供依据。

融合注意力机制的非对称深度监督哈希

王欣怡, 尹四清, 洪军

2023, 0(05): 26-31.

摘要 ( 284 )

PDF (5364KB) ( 69 )

参考文献 | 相关文章 | 计量指标

随着大数据时代的到来，互联网上的信息数据呈指数级增长。在这些数据中，图像资源占比巨大，因此如何在海量图像中进行准确而高效的图像检索成为当今的重要研究课题之一。目前大多数方法提取到的特征信息含有大量冗余信息，使得在图像检索中不能有效关注到图像的重点区域而导致检索性能差、准确度低等问题。基于以上不足，本文提出一种融合注意力机制的非对称深度哈希算法。以卷积神经网络为基础，对现有的由语义特征引导的混合注意力机制进行改进，将其嵌入进网络中，使得哈希网络将全局语义信息和局部语义信息共同分析。同时设计新的量化函数来减少量化误差，从而增强哈希编码的特征表达能力。并采用mAP作为评价指标，在数据集CIFAR-10和NUS-WIDE数据集上将本文方法与其他哈希方法进行比较，结果表明本文设计的网络模型能很好地结合全局和局部的特征信息，提高图像检索性能。

基于时空特征的短时出租车流量预测

苏金库, 桂智明

2023, 0(05): 32-38.

摘要 ( 234 )

PDF (2206KB) ( 59 )

参考文献 | 相关文章 | 计量指标

针对以往客流量预测只关注数据的时序特征而忽略空间维度特征及天气等外在因素的缺点，本文提出一种结合注意力机制的卷积门控时空预测模型（KSTCGN）来预测出租车客流量。该模型运用卷积神经网络（CNN）对网格内每个时段的流量进行空间维度的特征提取，使用门控循环单元（GRU）对客流量进行时间特征的提取。其中，卷积层引入CBAM注意力机制对重要的空间点进行更多关注。GRU层结合注意力机制关注对流量有重要影响的时段，并使用K-means聚类算法对不同时段进行聚类。通过实验分析，并与部分经典预测算法进行对比，证明了提出的组合模型能够有效提高预测精度。

基于时空注意力机制的基坑位移预测方法

王玉立, 杨昌松, 邱劲, 韦俊, 吴宏杰,

2023, 0(05): 39-45.

摘要 ( 194 )

PDF (1807KB) ( 41 )

参考文献 | 相关文章 | 计量指标

基坑安全管理是大型建筑基坑施工的关键内容，基坑结构位移预测是预防基坑支护事故的重要手段。但是由于基坑局部基坑位移成因复杂，现有的支持向量回归（SVR）、随机森林（RF）方法忽略了基坑位移随空间位移局部减弱、随时间局部位移加快增长的特点，导致预测精度不高。因此，本文提出一种融合时空注意力机制的GA-BP神经网络（A-GA-BP）方法，通过时空特征准确表示基坑位移预测的时空维度及其特征相关性，提高基坑位移预测的有效性。最后，本文以苏州市某大型工程为实例，对基坑的水平与垂直位移监测数据进行模型训练与评估，按时域特征、空域特征、多阶时域空域特征进行量化分析与研究，并与现有方法进行比较。实验结果表明，本文方法的拟合指数比其他几种方法分别提高29.19%与41.25%，多阶时空域特征相较于单独的时间域或空间域特征分别提高3.08%与1.83%。

工控网络异常检测中基于灵敏度的动态迁移算法

杨骏, 王劲林, 倪宏, 盛益强,

2023, 0(05): 46-51.

摘要 ( 177 )

PDF (1304KB) ( 26 )

参考文献 | 相关文章 | 计量指标

随着工控网络信息化程度的不断提高，工控网络逐渐变得更加开放，一方面给工业生产提供了便捷，但另一方面也带来了安全隐患。工控网络作为重要的基础设施，一旦受到攻击将产生严重损害。近年来不少学者使用网络异常检测技术来发现工控网络中潜在的安全隐患，取得不错的成果。然而工控网络中的数据往往缺少标注，这限制了传统监督学习类算法在工控网络安全领域的应用。基于非监督学习的算法可以在缺少标注的场景下实现异常检测，但是往往存在算法性能较差的问题，而迁移学习类算法可以通过在源域上学习后迁移到只有少量标注的目标域实现在少标注情况下的较高性能。为了进一步提高在缺少标注的工控网络中进行异常检测的性能，本文提出一种工控网络异常检测中基于灵敏度的动态迁移算法。首先该算法基于迁移学习的思想，在有标注的源域中进行训练后迁移到缺乏标注的目标域，可以在缺少标注的工控网络环境下进行异常检测。其次得益于门控循环单元的记忆效应，该算法可以有效利用工控网络数据内在的时序关联性，进一步提高算法异常检测的能力。同时该算法中的基于参数灵敏度因子对参数进行动态迁移的方法，改进了传统迁移学习微调方法对源域和目标域数据底层特征学习不均衡的不足。在KDD99数据集和Kyoto2016数据集上的对比实验表明，该算法采用的基于灵敏度的动态迁移学习方法对比传统微调方法具有更好的效果。在与最新一系列无监督与迁移学习算法的对比中，该算法在精确率、召回率和综合性的F1分数上均优于对比方法，取得了0.97、0.95、0.96的优秀性能。

基于辅助学习的改进端到端合成语音检测方法

袁甜甜, 李志华, 邱阳

2023, 0(05): 52-57.

摘要 ( 208 )

PDF (2323KB) ( 40 )

参考文献 | 相关文章 | 计量指标

随着深度伪造技术的发展，合成语音检测面临越来越多的挑战。本文提出一种将辅助学习融入端到端模型的合成语音检测方法。将音频数据进行数据对齐后在不加提取任何手工特征的情况下直接输入到改进端到端模型，主任务进行真实语音与合成语音的二分类，同时选用不同合成语音类型判别作为辅助任务，为主任务的合成语音检测提供先验假设，并且对主辅任务的权重叠加进行了优化。通过在公开数据集ASVspoof2019及ASVspoof2015上进行的实验结果表明，本文改进的模型与使用手工特征的模型相比能有效降低等错率，且优于改进前的端到端模型，并且在面对未知攻击类型时拥有更好的泛化能力。

未知协议状态机推断技术研究综述

盛嘉杰, 牛胜杰, 陈阳, 方伟青, 张玉杰, 李鹏, 胡素君

2023, 0(05): 58-67.

摘要 ( 293 )

PDF (2194KB) ( 88 )

参考文献 | 相关文章 | 计量指标

协议逆向工程（PRE）描述了协议的行为逻辑，一般分为协议格式提取和状态机构造2个步骤。这2个步骤既相互关联又相互独立，在网络安全领域具有重要意义。本文全面梳理PRE协议状态机推理的相关文献，总结分析协议状态机推理的研究现状和发展趋势。首先，本文介绍PRE的形式化定义和基本原则，并讨论主要领域的具体要求。其次，分析状态机推理方法，并将其分为3种模式：聚类方法、状态相关方法和轮询状态实体方法，然后从不同的角度比较算法的逆向能力和时间效率。最后展望协议状态机推理的发展趋势。

一种面向多源数据的智慧园区管理平台

周明升, 张雯

2023, 0(05): 68-74.

摘要 ( 199 )

PDF (2755KB) ( 51 )

参考文献 | 相关文章 | 计量指标

智慧园区通过物联网、云计算、大数据等新一代信息技术应用，实现园区管理服务的自动化、智能化和智慧化，推动园区高质量发展。本文提出一种面向多源数据的智慧园区管理平台架构设计，构建智慧园区数据管理网关，集成扩展园区设备设施专业管理系统、整合已有园区管理和服务的信息化成果、新建基于物联网的园区实时状态感知系统，解决园区管理中多系统、多架构、多标准的“信息孤岛”和数据交互问题。通过GIS全景地图呈现和业务功能联动，实现园区房产和设备设施集中展示、集成管理和统一调度，为园区运行监控和经营管理提供实时、全面、准确的技术支撑平台，在上海自贸区得以实现，取得了良好的经济和社会效益。

海南气象灾害预警信号有效性评价系统设计与实现

田光辉, 沈小芸, 吴俞

2023, 0(05): 75-79.

摘要 ( 195 )

PDF (2344KB) ( 33 )

参考文献 | 相关文章 | 计量指标

气象灾害预警信号是各地气象台站发布的重要气象信息，在防御和减轻气象灾害影响中发挥重要作用，开展预警信号评价是提升预警信号发布的质量，提高气象服务水平的关键所在。为科学评价预警信号发布的有效性，本文根据海南预警信号发布标准和有效性评价办法，采用C/S架构，以SQL Server数据库、VS.net C#语言，开发设计基于面向对象的技术方法、UML语言抽象描述的海南气象灾害预警信号有效性评价系统，实现对预警信号发布有效性的快速定量化评价，为进一步提升气象灾害预警信号发布的现代化水平和服务效益提供技术支撑。系统可为预警业务管理部门和预报预警发布人员提供快捷方便的技术支撑，有效提升气象预警业务的现代化水平。

基于改进UpdateNet的行人视觉跟踪算法

胡肖, 焦立男, 柳有权

2023, 0(05): 80-85.

摘要 ( 180 )

PDF (3087KB) ( 46 )

参考文献 | 相关文章 | 计量指标

目前，基于孪生网络的跟踪器主要是把跟踪过程看作是目标模板分支和待检测区域分支的一种互相关计算，它能够在速度和精度方面达到一个良好的均衡。然而,在跟踪过程中当前帧模板是对前一帧累积模板的线性结合，目标遮挡的问题一直很难被解决。针对该问题，本文采用改进SiamRPN跟踪器并融合UpdateNet网络的方案实现对行人单目标的跟踪。首先利用改进SiamRPN网络模块生成线性模板，然后在此基础上融合UpdateNet网络生成更新模板并进行多阶段训练，最后根据数据集的评价指标选取最优参数模型完成行人跟踪任务。本文在基准数据集OTB2015和其子集上进行实验，实验结果表明,本文所采用的方法取得的效果相比原来方法有明显提升，精度和成功率分别提高2.1和1.6个百分点，而且保持了实时跟踪帧率，同时在解决遮挡问题方面超过了DaSiamRPN、SiamDW等先进方法.

融合带权非局部模块的铝型材表面缺陷分类

王杰, 潘凤, 张艳莎, 谭棉, 严晓波, 王林,

2023, 0(05): 86-92.

摘要 ( 152 )

PDF (1590KB) ( 29 )

参考文献 | 相关文章 | 计量指标

针对铝型材表面缺陷分类任务中存在的极端长宽比、小面积缺陷分类困难问题，提出基于融合带权非局部模块和辅助分类器的表面缺陷分类方法（Fusion of Weighted Non-local Modules and Auxiliary Classifier Networks， FWACNet）。该方法通过提出带权非局部模块，利用点积相似度计算特征图空间上不同位置的相似性，以提升模型捕捉长距离依赖关系及上下文信息的能力；同时考虑到浅层特征中的纹理、边缘等细节信息会影响表面缺陷分类效果，设计深层和浅层特征融合的辅助分类器，以提升模型对浅层特征中细节信息的挖掘能力。为验证所提FWACNet方法的有效性，在公开的铝型材表面缺陷数据集上进行仿真实验，实验结果表明FWACNet较主流分类网络在极端长宽比、小面积的缺陷分类困难的问题上具有一定优势，分类准确率达95.7%。

基于双分支特征拼接的行人重识别

潘凤, 王杰, 张艳莎, 谭棉, 何兴, 王林,

2023, 0(05): 93-99.

摘要 ( 169 )

PDF (1864KB) ( 34 )

参考文献 | 相关文章 | 计量指标

针对不同监控视觉的拍摄，行人重识别任务存在类内（同一行人）前后变化大被误判、类间（相似行人）模糊造成区分度低的问题，提出一种双分支特征拼接的行人重识别方法（Dual-branch Feature Concatenation Network， DFCNet）。该方法通过对网络的深度特征进行拼接，使特征信息互补，获得辨别性特征，并用批归一化层代替基础网络全局平均池化层后的全连接层，使用标签平滑交叉熵损失函数训练网络，解决类内变化大及类间模糊造成提取特征辨别性差的问题。为验证所建议方法的有效性，在Market1501、DukeMTMC-reID公开数据集上进行验证，其中在Market1501数据集上，Rank-1和mAP指标分别达到95.8%和94.3%。结果表明所建议方法在处理类内误判与类间难区分问题上具有良好性能，且识别精度优于对比的流行算法。

基于改进YOLOv5的小目标检测方法

王艺成, 张国良, 张自杰,

2023, 0(05): 100-105.

摘要 ( 369 )

PDF (2253KB) ( 78 )

参考文献 | 相关文章 | 计量指标

为了解决传统YOLOv5目标检测算法在检测小目标时存在检测精度不高和漏检的问题，提出一种基于改进YOLOv5的小目标检测方法。首先，为了使Anchor Box能更好地适应小目标，在K-means聚类过程中，使用IOU（Interp Over Union）替换原始使用的欧几里得距离公式，重新定义Anchor Box和Ground Truth之间的距离；其次，在空间金字塔池化（Spatial Pyarmid Pooling， SPP）上增加一个池化核大小为3×3的最大池化，提高对小目标的检测精度；最后，制作一个包含多种小型目标的数据集以验证算法性能。实验结果表明：改进YOLOv5算法的验证平均精度（mean Average Precision， mAP）达到76.92%，与经典YOLOv5算法相比提升了3.56个百分点，检测效果有所提升且能检测出漏检目标。

基于图像阈值优化及改进SVM的电表数字识别

尹建丰, 卫鑫, 顾雄伟, 黄凯, 魏敏捷

2023, 0(05): 106-110.

摘要 ( 195 )

PDF (1509KB) ( 38 )

参考文献 | 相关文章 | 计量指标

针对电表出厂的校对和极端环境的测试工作，仍然需要人工检测电表是否出现内部元件错误或误差问题，提出一种基于图像阈值优化及改进SVM的电表数字识别方法。首先对图像使用边缘查找获取图像的显示区域，采用自适应阈值进行二值化处理，再对图像进行一系列的滤波处理，然后为进一步提取单个数字的图像，结合图像阈值优化，在保留数字图像特征值的前提下，去除多余的特征值，将显示区域图像划分成若干个单个数字图像。最后基于改进的SVM多分类识别模型进行0~9每个数字的训练，使用训练后的模型依次对单个数字图像进行识别。实验结果表明，对比经典的卷积神经网络模型对LED液晶数字的识别，基于图像阈值优化及改进SVM模型有着更快的识别速度和较高的准确率。

基于Multiscale-Net的膝关节半月板分割方法

王娟, 李传庚, 张卿源, 夏承遗

2023, 0(05): 111-116.

摘要 ( 179 )

PDF (1641KB) ( 37 )

参考文献 | 相关文章 | 计量指标

膝关节半月板分割的精确度对于半月板撕裂等级的判别和诊断具有重大意义，为了提高分割精度，本文提出一种基于多尺度网络（Multiscale-Net）的膝关节半月板分割方法。该方法结合视觉几何组网16（Visual Geometry Group Network16， VGG16）的卷积层和池化层以及U-Net网络的解码器部分，将编码器和解码器相连的3×3卷积层替换为改进的空间卷积池化金字塔（Atrous Spatial Pyramid Pooling， ASPP）模块。最后在安徽医科大学第一附属医院提供的临床病人的真实数据集上进行验证并与U-Net、引入ASPP模块的U-Net等模型进行对比。实验结果表明本文方法的交并比（Intersection over Union， IoU）和DSC相似系数（Dice Similarity Coefficient， DSC）分别达到91.25%和94.89%。

改进YOLOv5算法的遥感图像车辆检测

朱理清, 李祥,

2023, 0(05): 117-121.

摘要 ( 277 )

PDF (2658KB) ( 56 )

参考文献 | 相关文章 | 计量指标

针对遥感图像中背景复杂目标、车辆小导致的成像模糊的目标漏检问题，提出一种基于YOLOv5s的改进模型。改进模型设计一种新的主干网络结构：改进模型的主干特征提取选用RepVGG网络，同时在主干网络中加入注意力机制CoordAttention来提高模型小目标的感知能力。增加多尺度特征融合，提高改进模型对于小目标的检测精度，边框回归的损失函数选择使用DIoU，帮助改进模型实现更加精准定位。实验结果表明，改进后的YOLOv5模型在遥感图像的目标检测，相较于原始模型在小目标车辆中检测精度提升5.3个百分点，与Faster R-CNN相比mAP提升16.88个百分点。改进后的模型与主流的检测算法相比能有较大的检测精度提升，相较于原始的YOLOv5s模型在遥感图像小车辆检测有更好的检测精度。

基于YOLOv5s的遥感图像的车辆小目标检测

邱地发, 于淑芳, 刘锦辉, 毕梦昭

2023, 0(05): 122-126.

摘要 ( 281 )

PDF (1941KB) ( 61 )

参考文献 | 相关文章 | 计量指标

由于YOLOv5s检测效果好、计算复杂度低而被广泛应用于各类目标检测任务，但是其过大的下采样步长导致对卫星遥感图像中的车辆小目标检测难以获得满意的结果。为了提升对小目标检测的性能，基于YOLOv5s采取降低下采样步长的策略以保护车辆小目标的纹理和几何特性，同时在检测头前插入注意力机制模块以抑制复杂背景对目标的干扰。在0.5 m/pixel分辨率的自建数据集上进行测试，提出的SA-YOLOv5s对车辆目标检测的AP、Recall、Precision值分别达到90.1%、89%和 87.3%，与YOLOv5s相比分别提升了16.4、6和5个百分点，表现出良好的检测性能。

当期目录