计算机与现代化

庄文华, 唐晓刚, 张斌权, 原光明

2023, 0(01): 1-6.

摘要 ( 528 )

PDF (7034KB) ( 158 )

参考文献 | 相关文章 | 计量指标

为解决夜间低照度条件下目标检测准确率偏低的问题，提出一种基于循环生成对抗网络的高照度可见光图像生成方法。为提高生成器提取特征的能力，在转换器模块引入CBAM注意力模块；为避免在生成图像中产生伪影的噪声干扰，把生成器解码器的反卷积方式改为最近邻插值加卷积层的上采样方式；为了提高网络训练的稳定性，把对抗损失函数由交叉熵函数换为最小二乘函数。生成的可见光图像与红外图像、夜间可见光图像相比，在光谱信息、细节信息丰富和可视性方面取得好的优势提升，能够有效地获取目标和场景的信息。分别通过图像生成指标和目标检测指标验证该方法的有效性，其中对生成可见光图像测试得到的mAP较红外图像和真实可见光图像分别提高了11.7个百分点和30.2个百分点，可以有效提高对夜间目标的检测准确率和抗干扰能力。

基于改进的Transformer_decoder的增强图像描述

林椹尠, 屈嘉欣, 罗亮

2023, 0(01): 7-12.

摘要 ( 602 )

PDF (1421KB) ( 138 )

参考文献 | 相关文章 | 计量指标

Transformer的解码器（Transformer_decoder）模型已被广泛应用于图像描述任务中，其中自注意力机制（Self Attention）通过捕获细粒度的特征来实现更深层次的图像理解。本文对Self Attention机制进行2方面改进，包括视觉增强注意力机制（Vision-Boosted Attention， VBA）和相对位置注意力机制（Relative-Position Attention， RPA）。视觉增强注意力机制为Transformer_decoder添加VBA层，将视觉特征作为辅助信息引入Self Attention模型中，指导解码器模型生成与图像内容更匹配的描述语义。相对位置注意力机制在Self Attention的基础上，引入可训练的相对位置参数，为输入序列添加词与词之间的相对位置关系。基于COCO2014进行实验，结果表明VBA和RPA这2种注意力机制对图像描述任务都有一定改进，且2种注意力机制相结合的解码器模型有更好的语义表述效果。

基于NS-StyleGAN2的鱼类图像扩充方法

李海涛, 胡泽涛, 张俊虎

2023, 0(01): 13-17.

摘要 ( 354 )

PDF (2725KB) ( 332 )

参考文献 | 相关文章 | 计量指标

图像多分类领域中经常出现类别不平衡问题，这会对分类模型的学习训练产生负面影响。通过对样本数量较少的类别进行扩充可以有效解决类别不平衡问题。生成对抗网络作为近年来新兴的一种神经网络，输入真实图像样本训练可以输出与真实样本非常相似的生成样本。根据此特性，本文结合第二代样式生成对抗网络（StyleGAN2）的设计思想与鱼类图像的特点，设计一种噪声抑制样式生成对抗网络NS-StyleGAN2 （Noise-Suppressed Style Generative Adversarial Networks 2）。NS-StyleGN2去除了StyleGAN2合成网络中低分辨率层的噪声输入，从而抑制低分辨率层的噪声权重，使StyleGAN2生成样本细节特征更逼近真实样本特征。采用202张鲢鱼图像进行训练，本文提出的方法在起始分数、弗雷歇起始距离、内核起始距离得分等方面均优于DCGAN、WGAN、StyleGAN2，表明该方法可以有效进行图像扩充。

基于SE-ResNeXt的苹果叶片分类方法

白旭光, 刘成忠, 韩俊英, 高嘉蒙, 陈俊康

2023, 0(01): 18-23.

摘要 ( 335 )

PDF (2370KB) ( 115 )

参考文献 | 相关文章 | 计量指标

基于现有深度学习技术，采用基于残差神经网络ResNet的变体SE-ResNeXt，构建可以自动进行苹果品种分类的卷积神经网络模型，并基于迁移学习方法训练模型。数据来源于甘肃省静宁县苹果产业基地拍摄的20类苹果叶片图像，其中每类苹果叶的图片数据量为50幅，合计1000幅。在该数据集上，对ResNet50、ResNet101、SE-ResNet50、SE-ResNet101、SE-ResNeXt50、SE-ResNeXt101这6个模型进行对比实验。结果表明，SE-ResNeXt101的结果优于其它对比模型，最高准确率达到97.5％，单张图片推断时间仅0.125 s。本文方法为今后苹果种植过程中高效、准确地识别苹果品种提供了一种手段，对辅助农技科研与苹果种植具有较大的帮助作用。

基于局部重叠区域的无显著特征图像配准算法

杨旭朝, 雷志勇, 王娇娇

2023, 0(01): 24-29.

摘要 ( 349 )

PDF (7605KB) ( 182 )

参考文献 | 相关文章 | 计量指标

针对沙漠、戈壁等特征不显著场景在配准过程中存在快速性、精确性等问题，提出一种基于局部重叠区域的特征不显著图像配准方法。首先利用图像标记对待配准图像进行预处理增强其特征，接着通过多相机三维投影对多幅待配准图像重叠区域进行预算，并采用图像掩膜和图像分割技术将重叠区域分割出来，最后对重叠区域使用ORB+GMS（Oriented Brief-Grid-based Motion Statistics for Fast）融合算法进行配准，完成多幅图像的配准工作。基于图像重叠区域的配准避免了无显著特征图像在进行整体配准时精确性低的缺点，并且由于是局部配准，相较于全局配准拥有更快的配准速度。对比传统配准方法和本文提出的改进配准方法，实验结果显示，本文提出的改进方法配准精度在传统配准方法的基础上提升了28%，同时，算法具有更高的鲁棒性和实时性。

基于多特征因子融合的中文短文本实体消歧

王永缔, 雷刚

2023, 0(01): 30-36.

摘要 ( 348 )

PDF (1375KB) ( 138 )

参考文献 | 相关文章 | 计量指标

现有中文短文本实体消歧模型在消歧过程中大多只考虑指称上下文与候选实体描述的语义匹配特征，对同一查询文本中候选实体间的共现特征以及候选实体与实体指称类别相似特征等有效的消歧特征考虑不足。针对这些问题，本文首先利用预训练语言模型获得指称上下文与候选实体描述的语义匹配特征；然后，针对实体嵌入和指称类别嵌入提出共现特征与类别特征；最后，通过融合上述特征实现基于多特征因子融合实体消歧模型。实验结果表明本文提出的共现特征及类别特征在实现实体消歧中的可行性和有效性，以及本文提出的基于多特征因子融合的实体消歧方法能够取得更好的消歧效果。

基于多卷积神经网络融合的SAR舰船分类

张骁, 吕继宇, 赵爽, 吴羽纶, 王春乐

2023, 0(01): 37-42.

摘要 ( 336 )

PDF (3992KB) ( 86 )

参考文献 | 相关文章 | 计量指标

针对SAR图像中小型舰船分类准确率较低的问题，提出一种多卷积神经网络加权融合的方法。首先构建高分辨率卷积神经网络对特征图进行多尺度融合，引入微调模型和标签平滑减少训练过拟合的问题；然后利用高分辨网络、MobileNetv2网络和SqueezeNet网络训练3种单分类模型；最后采用加权投票方式对3种分类模型的结果进行融合。采用融合算法对GF-3号舰船数据集进行分类实验，取得94.83%的准确率、95.43%的召回率和0.9513的F1分数的分类性能。实验结果表明，该舰船分类算法模型具有较优的分类能力，验证了其在高分辨率SAR图像舰船分类上的有效性。

基于藏文BERT的藏医药医学实体识别

朱亚军, 拥措, 尼玛扎西,

2023, 0(01): 43-48.

摘要 ( 364 )

PDF (1464KB) ( 126 )

参考文献 | 相关文章 | 计量指标

藏医药文本字符嵌入对藏医药医学实体识别有着重要意义，但目前藏文缺少高质量的藏文语言模型。本文结合藏文结构特点使用普通藏文新闻文本训练基于音节的藏文BERT模型，并基于藏文BERT模型构建BERT-BiLSTM-CRF模型。该模型首先使用藏文BERT模型对藏医药文本字符嵌入进行学习，增强字符嵌入对藏文字符及其上下文信息的表示能力，然后使用BiLSTM层进一步抽取藏医药文本中字符之间的依赖关系，最后使用CRF层强化标注序列的合法性。实验结果表明，使用藏文BERT模型初始化藏医药文本字符嵌入有助于提高藏医药医学实体识别效果，F1值达96.18%。

基于预训练模型的关系抽取研究综述

王浩畅, 刘如意

2023, 0(01): 49-57.

摘要 ( 730 )

PDF (1190KB) ( 318 )

参考文献 | 相关文章 | 计量指标

近年来随着深度学习技术的不断革新，预训练模型在自然语言处理中的应用也越来越广泛，关系抽取不再是单纯地依赖传统的流水线方法。预训练语言模型的发展已经极大地推动了关系抽取的相关研究，在很多领域已经超越了传统方法。首先简要介绍关系抽取的发展与经典预训练模型；其次总结当下常用的数据集与评测方法，并分析模型在各数据集上的表现；最后探讨关系抽取发展的挑战与未来研究趋势。

基于协调影响流量的交叉口群主要流线识别

张建旭, 吴成峰

2023, 0(01): 58-62.

摘要 ( 251 )

PDF (1718KB) ( 81 )

参考文献 | 相关文章 | 计量指标

为了确定交叉口群的主要流线，以更好地进行交叉口群协调控制，建立基于协调影响流量交叉口群主要流线识别算法。首先分析路径协调影响流量成分，通过对交叉口群范围内的浮动车轨迹路径进行统计分析，确定备选主要流线并计算流线协调影响浮动车数量；然后利用交叉口流量和转向比例估计备选主要流线的协调影响流量；最后根据备选主要流线的统计协调影响浮动车数量和估计协调影响流量来计算流线权重指标，通过权重指标确定交叉口群的主要流线。以西安雁塔区划分的一个交叉口群为例，对交叉口群主要流线进行识别，验证本文算法的效果。实验结果表明，本文算法能利用浮动车数据和流量数据对交叉口群主要流线进行实时识别，为交叉口群信号协调控制提供支撑。

混合多尺度卷积结合双层LSTM语音情感识别

梁科晋, 张海军, 刘雅情, 张昱, 王月阳

2023, 0(01): 63-68.

摘要 ( 456 )

PDF (1137KB) ( 183 )

参考文献 | 相关文章 | 计量指标

针对深度学习算法在语音情感特征提取方面的不足以及识别准确率不高的问题，本文通过提取语音数据中有效的情感特征，并将特征进行多尺度拼接融合，构造语音情感特征，提高深度学习模型对特征的表现能力。传统递归神经网络无法解决语音情感识别长时依赖问题，本文采用双层LSTM模型来改进语音情感识别效果，提出一种混合多尺度卷积与双层LSTM模型相结合的模型。实验结果表明，在中科院自动化所汉语情感数据库（CASIA）和德国柏林情感公开数据集（Emo-DB）下，本文所提语音情感识别模型相较于其他情感识别模型在准确率方面有较大提高。

基于深度学习的股票趋势预测算法

周润佳

2023, 0(01): 69-73.

摘要 ( 976 )

PDF (1263KB) ( 320 )

参考文献 | 相关文章 | 计量指标

针对股票趋势预测难的问题，提出一种利用CNN和LSTM进行特征提取，并结合注意力机制和对抗训练的股票趋势预测算法——AACL（Adversarial Attentive CNN-LSTM）算法。该算法利用CNN提取股票的整体趋势信息，LSTM提取股票的短期波动信息，并通过注意力机制将多个股票联系起来，捕捉股票之间的涨跌关系。算法还引入了对抗训练，通过对数据进行干扰，提高算法的鲁棒性。为了验证算法的有效性，在KDD17、ACL18和China50这3个数据集上进行实验，并与现有的算法进行比较，实验结果表明本文提出的算法可以获得最优的预测效果。

面向图卷积神经网络鲁棒防御方法

钱晓钊, 王澎

2023, 0(01): 74-80.

摘要 ( 401 )

PDF (2403KB) ( 150 )

参考文献 | 相关文章 | 计量指标

近来对图卷积神经网络（GCNs）的研究及其应用日益成熟，虽然它的性能已经达到很高的水准，但GCNs在受到对抗攻击时模型鲁棒性较差。现有的防御方法大都基于启发式经验算法，没有考虑GCNs结构脆弱的原因。最近，已有研究表明GCNs脆弱的原因是非鲁棒的聚合函数。本文从崩溃点和影响函数抗差性角度出发，分析平尾均值函数和均值聚合函数二者的鲁棒性。平尾均值相较于均值函数，其崩溃点更高。平尾均值的影响函数跳跃有界，可抵抗异常值；而均值函数的影响函数无界，对异常值十分敏感。随后在GCNs框架的基础上，通过将图卷积算子中的聚合函数更换为更为鲁棒的平尾均值，提出一种改进的鲁棒防御方法WinsorisedGCN。最后采用Nettack对抗攻击方法研究分析所提出的模型在不同扰动代价下的鲁棒性，通过准确率和分类裕度评价指标对模型性能进行评估。实验结果表明，所提出的防御方案相较于其他基准模型，能够在保证模型准确率的前提下，有效提高模型在对抗攻击下的鲁棒性。

基于对抗域适应的心电信号深度学习分类算法

蒋思清, 陈潇俊, 高豪俊, 何佳晋, 吴健,

2023, 0(01): 81-87.

摘要 ( 339 )

PDF (2339KB) ( 120 )

参考文献 | 相关文章 | 计量指标

心血管疾病已成为威胁人类生命健康的主要疾病之一。心电图是临床上常见的诊断心律失常的重要方法并被广泛用于监测心脏病患者的健康状况。由于现有的医疗资源匮乏，使用人工智能的方法来分析和诊断从而克服这些局限性的需求愈加迫切，在临床中使用自动检测和分类方法，可以帮助医生对疾病做出准确、快速的诊断。本文对8种常见的心律失常类型进行分类，提出一种基于对抗域自适应的心电信号深度学习分类的方法，解决并改善训练样本标注不足和个体差异导致的数据分布差异现象等问题。该方法包括3个模块：多尺度特征提取A模块、域识别B模块和多分类器C模块。A模块由2组不同的并行卷积块组成，增加了特征提取的宽度。B模块由3个卷积块和1个全连接层组成，用于充分提取浅层特征。在C模块中，将时间特征和深度学习提取特征串联在全连接层上，增强特征多样性。实验结果表明，该方法在准确率、敏感性和阳性预测值上可达到98.8%、97.9%和98.1%，所提出的模型可以帮助医生在常规心电图中准确地检测不同类别的心律失常。

基于模拟退火的扩展孤立森林异常检测算法

王诗愉, 肖利东, 严心淳, 应文豪

2023, 0(01): 88-94.

摘要 ( 608 )

PDF (1393KB) ( 149 )

参考文献 | 相关文章 | 计量指标

扩展孤立森林（Extended Isolation Forest， EIF）有效解决了孤立森林（Isolation Forest， iForest）对局部异常点不敏感的问题，但EIF将轴平行的孤立条件更替为使用随机斜率的超平面，导致算法模型损失了一部分泛化能力，并由于大量的向量点乘运算增加了时间开销。针对上述情况，提出一种基于模拟退火的扩展孤立森林算法（Extended Isolation Forest based on Simulated Annealing， SA-EIF）。该算法根据每棵孤立树（Isolation Tree， iTree）对于数据集的预测结果计算每棵iTree的精度值和差异值，并基于此构建适应度函数，最终利用模拟退火算法筛选数棵检测性能较优的iTree构建集成学习模型。在ODDS 异常检测数据集中进行K折交叉验证的实验结果表明：SA-EIF算法对局部异常点敏感，较现有的EIF算法减少约20%~40% 的时间开销，提高约5%~10%的检测精度。

纠正学习策略下LightGBM-GRU模型的股票波动率预测

石志伟, 武志峰, 张哲

2023, 0(01): 95-102.

摘要 ( 551 )

PDF (1925KB) ( 169 )

参考文献 | 相关文章 | 计量指标

为提高传统智能算法进行时间序列预测时的精度和解决工程数据问题时的适应性，提出一种纠正学习策略。波动性广泛应用于金融领域，对股票的波动性进行预测具有重要的价值。由于股票价格的时间序列是非线性和非平稳的，预测股票市场波动成为时间序列预测中的难点。本文通过纠正学习策略进行仿真实验，设计出LightGBM-GRU模型，以LightGBM和GRU作为基模型和纠正器，预测3年内126只来自不同行业的股票在未来10 min的波动率，根据RMSPE、MAE、MSE、RMSE等指标表明：即使经典的效果比较好的集成学习模型，也能通过纠正学习策略同时提高精度和泛化能力。本文指出在算法富集和大数据的时代，智能算法的矛盾转变为智能算法通用性有限与工程问题多样性之间的矛盾，纠正学习策略可以为数据仿真提供新思路。

基于改进YOLOV5的火焰检测算法

王洪义, 孔梅梅, 徐荣青

2023, 0(01): 103-107.

摘要 ( 733 )

PDF (1474KB) ( 252 )

参考文献 | 相关文章 | 计量指标

针对现有的火焰检测算法检测平均精度低、小目标火焰漏检率高的问题，提出一种改进YOLOV5的火焰检测算法。该算法使用Transformer Encode模块代替YOLOV5主干网络末端的CSP bottleneck模块，以增强网络捕获不同局部信息的能力，提高火焰检测的平均精度，并且在YOLOV5网络中增加CBAM注意力模块，增强网络提取图像特征的能力，对于小目标火焰能够较好地提取特征，降低小目标火焰的漏检率。将该算法在公开数据集BoWFire、Bilkent上进行实验，结果表明，改进YOLOV5网络的火焰检测平均精度更高，可达83.9%，小目标火焰漏检率更低，仅为1.6%，检测速率为34帧/s，相比于原YOLOV5网络，平均精度提升了2.4个百分点，小目标火焰漏检率降低了4.1个百分点，改进后的YOLOV5网络能够满足火焰检测的实时性和精度要求。

基于改进XGBoost超参数优化的地下工程空调系统负荷预测

冯增喜, 陈海越, 王涛, 赵锦彤, 李诗妍

2023, 0(01): 108-113.

摘要 ( 422 )

PDF (2175KB) ( 111 )

参考文献 | 相关文章 | 计量指标

针对地下工程空调负荷难以精确预测的问题，提出一种基于天牛须搜索算法（Beetle Antennae Search， BAS）优化极限梯度提升算法（eXtreme Gradient Boosting， XGBoost）的负荷预测模型。该算法通过引入典型最优解引导机制优化常规BAS算法中的位置更新策略，同时采用线性递减策略对天牛的搜索步长进行修正，以实现更快达到全局最优点，提高收敛速度；并利用改进的BAS算法对XGBoost中的决策树个数、树的最大深度2个对模型预测精度有较大影响的超参数进行寻优，以获得XGBoost的最优参数组合，提高模型预测精度。最后，以某地下保障工程空调系统为研究对象，验证所提出的预测模型的有效性。

一种上下文信息融合的安全帽识别算法

肖立华, 徐畅, 商浩亮, 罗仲达, 吴小忠, 马小丰, 江志文, 陈俊杰

2023, 0(01): 114-119.

摘要 ( 291 )

PDF (1877KB) ( 78 )

参考文献 | 相关文章 | 计量指标

为了预防人员防护缺失导致的生产事故，着力探究复杂施工场景下人员安全帽佩戴情况的智能化识别。在一阶段目标检测算法的基础上，针对安全帽识别问题中的小目标和安全帽纹理信息缺失的问题，提出提取并融合上下文信息，以增强模型的表征学习能力。首先，为解决特征鉴别力不足的问题，提出局部上下文感知模块和全局上下文融合模块。局部上下文感知模块能够融合人体头部信息和安全帽信息获取具有鉴别力的特征表示；全局上下文融合模块将高层的语义信息与浅层特征融合，提升浅层特征的抽象能力。其次，为了解决小目标识别问题，提出使用多个不同的目标检测模块分别识别不同大小的目标。在构建的复杂施工场景下的安全帽识别数据集上的实验结果表明：提出的2个模块将mAP提高了11.46个百分点，安全帽识别的平均精度提高了10.55个百分点。本文提出的方法具有速度快、精度高的特点，为智慧工地提供了有效的技术解决方案。

基于BERT和非自回归的医疗知识抽取

于清, 马志龙, 徐春

2023, 0(01): 120-126.

摘要 ( 420 )

PDF (1336KB) ( 124 )

参考文献 | 相关文章 | 计量指标

为避免实体与关系独立抽取产生的误差累计及实体重叠问题，提出一种基于BERT和非自回归的联合抽取模型来进行医疗知识抽取。首先，通过BERT预训练语言模型进行句子编码；然后，采用非自回归（NAR， Non-autoregressive）的方法实现并行解码，抽取关系类型，并根据头尾实体的位置索引抽取实体，得到医疗实体的关系三元组；最后，将抽取出的实体和关系导入Neo4j图数据库中实现知识可视化。通过对电子病历中的数据进行人工标注得到数据集，实验结果表明，基于BERT和非自回归联合学习模型的F1值为0.92，precision值为0.93，recall值为0.92，与现有模型相比3项评价指标均有提升，表明本文方法能够有效抽取电子病历中的医疗知识。

当期目录