摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 结合注意力机制的深度神经网络综述
    皇甫晓瑛, 钱惠敏, 黄敏
    计算机与现代化    2023, 0 (02): 40-49.  
    摘要1160)      PDF(pc) (2408KB)(451)    收藏
    注意力机制已成为改进神经网络学习能力的研究热点之一。鉴于注意力机制受到的广泛关注,本文旨在从注意力机制的分类、与深度神经网络的结合方式,以及在自然语言处理和计算机视觉领域的具体应用3个方面对深度神经网络中的注意力机制给出较全面的分析和阐述。具体地,分析比较了软注意力、硬注意力和自注意力这3种机制的优缺点;并分别讨论了递归神经网络和卷积神经网络中结合注意力机制的常用方式及其代表性模型结构;然后,以自然语言处理、计算机视觉领域为例,说明了其应用情况;最后,分析了注意力机制的发展趋势,期望为后续研究提供线索和方向。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    2. 一种基于BERT和池化操作的文本分类模型
    张军, 邱龙龙
    计算机与现代化    2022, 0 (06): 1-7.  
    摘要917)      PDF(pc) (948KB)(190)    收藏
    使用预训练语言模型的微调方法在以文本分类为代表的许多自然语言处理任务中取得了良好的效果,尤其以基于Transformer框架的BERT模型为典型代表。然而,BERT直接使用[CLS]对应的向量作为文本表征,没有从全局和局部考虑文本的特征,从而限制了模型的分类性能。因此,本文提出一种引入池化操作的文本分类模型,使用平均池化、最大池化以及K-MaxPooling等池化方法从BERT输出矩阵中提取文本的表征向量。实验结果表明,与原始的BERT模型相比,本文提出的引入池化操作的文本分类模型具有更好的性能,在实验的所有文本分类任务中,其准确率和F1-Score值均优于BERT模型。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    3. 基于深度学习的股票趋势预测算法
    周润佳
    计算机与现代化    2023, 0 (01): 69-73.  
    摘要833)      PDF(pc) (1263KB)(297)    收藏
    针对股票趋势预测难的问题,提出一种利用CNN和LSTM进行特征提取,并结合注意力机制和对抗训练的股票趋势预测算法——AACL(Adversarial Attentive CNN-LSTM)算法。该算法利用CNN提取股票的整体趋势信息,LSTM提取股票的短期波动信息,并通过注意力机制将多个股票联系起来,捕捉股票之间的涨跌关系。算法还引入了对抗训练,通过对数据进行干扰,提高算法的鲁棒性。为了验证算法的有效性,在KDD17、ACL18和China50这3个数据集上进行实验,并与现有的算法进行比较,实验结果表明本文提出的算法可以获得最优的预测效果。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    4. 基于改进YOLOv5s的道路坑洼检测算法
    白芮, 徐杨, 王彬, 张雯雯
    计算机与现代化    2023, 0 (06): 69-75.   DOI: 10.3969/j.issn.1006-2475.2023.06.012
    摘要757)      PDF(pc) (3457KB)(129)    收藏
    针对现有目标检测算法难以对道路坑洼进行精准检测、检测速度慢等问题,提出一种基于改进YOLOv5s的道路坑洼检测算法。首先在YOLOv5s主干网络中融入坐标注意力(Coordinate Attention, CA)模块,使模型不仅捕获跨通道信息,还捕获方向和位置敏感信息,有助于模型更准确地定位和识别检测对象;然后在空间金字塔池化(Spatial Pyramid Pool, SPP)模块中采用软池化SoftPool改进最大池化操作,保留更详细的特征信息;在特征融合阶段,使用基于内容的功能重组 (Content-Aware ReAssembly of Features, CARAFE)对多尺度特征融合中上采样进行改进,动态生成自适应内核,可以在一个大的感受野内聚集上下文信息;最后,使用Alpha-IoU对损失函数进行改进,提高边框回归精度。实验结果表明,改进的YOLOv5s算法在平均精度上较原始网络提高了4.6个百分点,与其他主流算法SSD、Faster R-CNN、YOLOv3、YOLOv3-tiny、YOLOv4-tiny相比检测精度有较大提升。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    5. 模型剪枝算法综述
    李屹, 魏建国, 刘贯伟
    计算机与现代化    2022, 0 (09): 51-59.  
    摘要714)      PDF(pc) (1096KB)(233)    收藏
    模型剪枝算法利用不同的标准或方式对深度神经网络中冗余神经元进行裁剪,在不损失模型精度的情况下对模型进行最大程度的压缩,从而可以减少存储并提升速度。首先,对模型剪枝算法的研究现状与主要研究方向进行总结并归类。主要研究方向包括剪枝的尺度、剪枝元素重要性评估的方法、剪枝的稀疏度、剪枝的理论基础及对于不同任务的剪枝等方面。然后对近年来具有代表性的剪枝算法进行详细描述。最后对此领域的研究提出未来展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    6. 基于深度学习的人体行为检测方法研究综述
    沈加炜, 陆一鸣, 陈晓艺, 钱美玲, 陆卫忠,
    计算机与现代化    2023, 0 (09): 1-9.   DOI: 10.3969/j.issn.1006-2475.2023.09.001
    摘要685)      PDF(pc) (2112KB)(229)    收藏
    当下结合计算机视觉和视频的特征提取对人体行为动作进行捕捉识别的研究炙手可热,并且其在智能视频监控和智能家居的人机交互等其他领域方向上的应用场景也十分丰富。基于传统方法的人体行为检测算法有着依赖数据样本过多、易受环境噪音影响从而降低精确率等缺点,而不断发展的深度学习技术逐渐展现出它的优势,可以很好地解决这些问题。本文基于此,首先介绍一些目前常用的行为识别数据集并在此基础上剖析当下基于深度学习的人体行为识别检测的研究现状;其次描述常见的人体行为识别检测方法及其识别的流程;最后对现存的各种行为识别检测方法性能、现存问题进行总结和未来发展方向进行展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    7. 《平凡的世界》人物关系网络分析
    王君, 何进荣, 马乐荣
    计算机与现代化    2022, 0 (06): 32-36.  
    摘要635)      PDF(pc) (1405KB)(161)    收藏
    文学作品中人物关系网络的构建与定量分析是文学作品智能化解读的重要内容。本文以路遥先生文学作品《平凡的世界》为研究对象,利用复杂网络分析方法,对文学作品中的社交网络进行构建和分析。首先提取作品中的社交网络关系,其中小说人物对应社交网络中的节点,人物之间的关系对应社交网络的边,各章人物共同出现次数对应于边的权重,然后对构建的网络进行介数、集聚系数相关性等网络指标分析及分层聚类和链路预测。实验结果表明《平凡的世界》作品中的人物关系网络是异配网络并具有小世界特性。该研究有助于推动文学作品中人物关系网络的分析。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    8. 基于混合策略改进的鲸鱼优化算法
    李茹, 范冰冰
    计算机与现代化    2022, 0 (06): 13-20.  
    摘要628)      PDF(pc) (1185KB)(149)    收藏
    针对原始鲸鱼优化算法(WOA)收敛速度慢、全局搜索能力弱、求解精度低且易陷入局部最优等问题,提出一种混合策略来改进的鲸鱼优化算法(LGWOA)。首先将莱维飞行引入鲸鱼全局搜索的公式中,通过莱维飞行加大全局搜索步长,扩大搜索空间、提高全局搜索能力;其次,在鲸鱼螺旋上升阶段,加入一个自适应权重参数来提高算法的局部搜索能力和求解精度;最后结合遗传算法的交叉变异思想平衡算法的全局搜索和局部搜索能力,维持种群的多样性,规避陷入局部最优。通过对12个基准测试函数从2个角度进行实验对比分析,结果表明,基于混合策略改进的鲸鱼优化算法在收敛速度和求解精度上均有明显提升。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    9. 基于多模态特征融合的抑郁症识别
    谷明轩, 范冰冰
    计算机与现代化    2023, 0 (10): 17-22.   DOI: 10.3969/j.issn.1006-2475.2023.10.003
    摘要626)      PDF(pc) (1213KB)(333)    收藏
    抑郁症是一种常见的精神疾病,现有的抑郁症诊断主要依赖于抑郁量表和精神科医生的访谈,具有较强的主观性。近年来,越来越多的研究者致力于通过脑电特征或音频特征识别抑郁症患者,但并未有研究将脑电信息与音频信息有效地结合起来,忽略了音频和脑电数据之间的相关性。因此本文提出一种基于全连接神经网络的多模态特征融合模型,通过对音频模态和脑电模态信息的特征融合提升抑郁症识别的准确率,为抑郁症的识别提供新的角度和方法。实验表明,多模态特征融合在MODMA数据集上的抑郁症识别准确率达到了81.58%且高于单模态抑郁症识别方法的准确率。这表明,相比于单模态识别,多模态特征融合模型能够提高抑郁症识别的准确率。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    10. 基于预训练模型的关系抽取研究综述
    王浩畅, 刘如意
    计算机与现代化    2023, 0 (01): 49-57.  
    摘要614)      PDF(pc) (1190KB)(295)    收藏
    近年来随着深度学习技术的不断革新,预训练模型在自然语言处理中的应用也越来越广泛,关系抽取不再是单纯地依赖传统的流水线方法。预训练语言模型的发展已经极大地推动了关系抽取的相关研究,在很多领域已经超越了传统方法。首先简要介绍关系抽取的发展与经典预训练模型;其次总结当下常用的数据集与评测方法,并分析模型在各数据集上的表现;最后探讨关系抽取发展的挑战与未来研究趋势。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    11. 计算机视觉下的果实目标检测算法综述
    李伟强, 王东, 宁政通, 卢明亮, 覃鹏飞
    计算机与现代化    2022, 0 (06): 87-95.  
    摘要612)      PDF(pc) (1939KB)(214)    收藏
    基于计算机视觉的果实目标检测识别是目标检测、计算机视觉、农业机器人等多学科的重要交叉研究课题,在智慧农业、农业现代化、自动采摘机器人等领域,具有重要的理论研究意义和实际应用价值。随着深度学习在图像处理领域中广泛应用并取得良好效果,计算机视觉技术结合深度学习方法的果实目标检测识别算法逐渐成为主流。本文介绍基于计算机视觉的果实目标检测识别的任务、难点和发展现状,以及2类基于深度学习方法的果实目标检测识别算法,最后介绍用于算法模型训练学习的公开数据集与评价模型性能的评价指标,且对当前果实目标检测识别存在的问题和未来可能的发展方向进行讨论。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    12. 基于改进YOLOV5的火焰检测算法
    王洪义, 孔梅梅, 徐荣青
    计算机与现代化    2023, 0 (01): 103-107.  
    摘要607)      PDF(pc) (1474KB)(234)    收藏
    针对现有的火焰检测算法检测平均精度低、小目标火焰漏检率高的问题,提出一种改进YOLOV5的火焰检测算法。该算法使用Transformer Encode模块代替YOLOV5主干网络末端的CSP bottleneck模块,以增强网络捕获不同局部信息的能力,提高火焰检测的平均精度,并且在YOLOV5网络中增加CBAM注意力模块,增强网络提取图像特征的能力,对于小目标火焰能够较好地提取特征,降低小目标火焰的漏检率。将该算法在公开数据集BoWFire、Bilkent上进行实验,结果表明,改进YOLOV5网络的火焰检测平均精度更高,可达83.9%,小目标火焰漏检率更低,仅为1.6%,检测速率为34帧/s,相比于原YOLOV5网络,平均精度提升了2.4个百分点,小目标火焰漏检率降低了4.1个百分点,改进后的YOLOV5网络能够满足火焰检测的实时性和精度要求。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    13. 基于CNN-Transformer混合结构的遥感影像变化检测模型
    许叶彤, 耿信哲, 赵伟强, 张 月, 宁海龙, 雷 涛
    计算机与现代化    2023, 0 (07): 79-85.   DOI: 10.3969/j.issn.1006-2475.2023.07.014
    摘要603)      PDF(pc) (2633KB)(173)    收藏
    卷积神经网络和Transformer模型的出现,使得遥感影像变化检测技术不断进步,但是目前这2种方法仍存在不足:一方面,卷积神经网络由于其卷积核局部感知的特点无法对遥感影像进行全局信息建模;另一方面,Transformer虽然可以捕获遥感影像的全局信息,但是对影像变化的细节信息不能很好地建模,且其计算复杂度随图像的分辨率呈二次方增长。为了解决上述问题,获得更稳健的变化检测结果,本文提出一种基于卷积神经网络和Transformer混合结构的变化检测模型(CNN-Transformer Change Detection Network, CTCD-Net)。首先,CTCD-Net串联使用卷积神经网络和基于Transformer编解码结构来有效地编码遥感影像的局部特征和全局特征,从而提升网络的特征学习能力。其次,提出跨通道的Transformer自注意力模块(CSA)和注意力前馈网络(A-FFN),有效地降低了Transformer的计算复杂度。在LEVIR-CD和CDD数据集上进行了充分的实验,实验结果表明,CTCD-Net的检测精确度显著优于目前其他主流方法。
    相关文章 | 多维度评价 | 评论0
    14. 基于TasNet的单通道语音分离技术的研究综述
    陆炜, 朱定局
    计算机与现代化    2022, 0 (11): 119-126.  
    摘要584)      PDF(pc) (1016KB)(125)    收藏
    语音分离是声学信号处理中的一项基本任务,具有广泛的应用。得益于深度学习的发展,近年来单通道语音分离系统的性能有了显着提升。特别是,随着一种被称为时域音频网络(Time-domain audio separation Network,TasNet)的新语音分离方法被提出,语音分离技术的研究也逐步从基于时-频域的传统方法过渡至基于时域的方法。本文综述基于TasNet的单通道语音分离技术的研究现状与展望。在回顾基于时-频域的语音分离传统方法之后,本文重点介绍基于TasNet的Conv-TasNet模型以及DPRNN模型,并对比针对各模型的改进研究。最后,本文阐述目前基于TasNet的单通道语音分离模型的局限性,并从模型、数据集、说话人数量以及如何解决复杂场景下的语音分离等层面对未来的研究方向进行讨论。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    15. 基于改进YOLOv5的安全帽佩戴检测
    岳衡, 黄晓明, 林明辉, 高明, 李扬, 陈凌
    计算机与现代化    2022, 0 (06): 104-108.  
    摘要576)      PDF(pc) (2508KB)(176)    收藏
    针对YOLOv5无法通过权重进行聚焦,产生更具有分辨性的特征,从而降低安全帽检测准确性的问题,使用注意力模块,并分别研究压缩激励层(Squeeze and Excitation Layer, SEL)和高效通道注意力(Efficient Channel Attention, ECA)模块。针对YOLOv5去除冗余框时采用的非极大值抑制(Non Maximum Suppression, NMS)在物体高度重叠时仅保留同类最高置信度预测框的问题,使用Soft-NMS算法保留更多的预测框,并进一步使用加权非极大值抑制(Weighted Non Maximum Suppression, WNMS)融合多次预测框信息提升预测框准确性;针对下采样带来的信息丢失问题,使用Focus模块提升检测效果;综合各个模块得到最优的FESW-YOLO算法。该算法在安全帽数据集上的mAP@0.5、mAP@0.5:0.95相较于YOLOv5分别提高了2.1个百分点、1.2个百分点,提升了安全帽监管准确性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    16. 基于深度学习的驾驶员分心行为识别
    何丽雯, 张锐驰
    计算机与现代化    2022, 0 (06): 67-74.  
    摘要548)      PDF(pc) (2347KB)(161)    收藏
    分心驾驶行为识别是提高驾驶安全的主要方法之一。针对分心驾驶行为识别精度低的问题,本文提出一种基于深度学习的驾驶员分心行为识别算法,由目标检测网络和行为精确识别网络级联构成。基于State Farm公开数据集,第一级利用目标检测算法SSD(Single Shot Multibox Detector)对数据集中的驾驶员原始图像进行局部信息提取,确定行为识别候选区域;第二级分别利用迁移学习VGG19、ResNet50和MobileNetV2模型对候选区域内的行为信息进行精确识别;最后,实验对比级联架构与单模型架构对分心驾驶行为的识别精度。结果表明,提出的级联网络模型相较于主流单模型检测方法,驾驶员行为识别的准确率总体上提升4~7%个百分点。该算法不仅减少噪声和其他背景区域对模型的影响,提高分心行为识别准确率,还可以有效识别更多的行为类别以避免动作的误分类。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    17. 基于改进PSO-TrICP算法的点云配准
    梁正友, 王璐, 李轩昂, 杨锋,
    计算机与现代化    2022, 0 (05): 90-95.  
    摘要537)      PDF(pc) (1109KB)(123)    收藏
    针对传统迭代最近点(Iterative Closest Point, ICP)算法在初始空间位置偏差大时,容易陷入局部最优的问题,提出一种基于改进PSO-TrICP算法的点云配准方法。首先,对传统粒子群(Particle Swarm Optimization, PSO)算法进行改进,引入适应度的相似度测量准则调整粒子的更新方式,然后加入历次迭代的全局最优解的均值作为新的学习因子避免求解过程中出现“早熟”现象;其次用刚性变换参数和点云间的重叠率组成粒子,利用改进PSO算法为配准提供良好的初始相对位置;最后,通过裁剪迭代最近点(Trimmed Iterative Closest Point, TrICP)算法估计点云间的空间变换。实验结果表明,改进PSO-TrICP算法的配准精度与运行效率优于近年提出的同类配准算法,且具有较好的鲁棒性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    18. BBR拥塞控制算法延迟及带宽探测优化
    黄宏平, 朱小勇, 王志远,
    计算机与现代化    2022, 0 (10): 113-120.  
    摘要521)      PDF(pc) (2082KB)(139)    收藏
    传统基于丢包的拥塞控制算法因为其高丢包率和引发缓冲区膨胀问题已经不能满足许多应用对网络性能的要求。谷歌提出的BBR(Bottleneck Bandwidth and Round Trip)算法以其抗丢包、高带宽利用率和低延迟等特性受到广泛关注与研究。但是BBR还存在排队延迟仍然较高、在RTT(Round Trip Time)较小环境下表现不佳、带宽探测不及时等问题。本文对BBR排队延迟和收敛性进行分析,进而提出改进方法:限制在外数据包数,并根据网络反馈适时减少拥塞窗口大小来降低延迟;在RTT较小环境下,将探测RTT阶段之前的带宽估计延续到探测RTT阶段之后;设置平稳状态最长保持时间及时退出平稳周期并进入探测周期。在NS3中的仿真实验结果表明,改进BBR降低了RTT及其抖动,提高了算法的收敛速度;能够在RTT较小环境下高效利用带宽;改进BBR能够显著提高长RTT流的带宽探测频率。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    19. 一种基于CBAM和改进通道注意力的EfficientNet的混合脑肿瘤分类方法
    华昕宇, 祁云嵩
    计算机与现代化    2023, 0 (05): 1-7.  
    摘要520)      PDF(pc) (1818KB)(106)    收藏
    为进一步提高脑肿瘤影像诊断的准确性和稳健性,提出一种基于CBAM(Convolutional Block Attention Module)和改进通道注意力机制的EfficientNet神经网络(IC+IEffxNet)的新型混合脑肿瘤分类方法。该方法分为2个阶段,第一阶段由基于改进空间注意力机制的CBAM模型提取特征。第二阶段将EfficientNet架构中的Squeeze and Excitation(SE)块替换成Efficient Channel Attention (ECA)块,将第一阶段的组合特征输出作为第二阶段的输入。实验展示了在混合脑肿瘤MRI数据集下,神经胶质瘤患者、脑膜瘤患者、脑垂体瘤患者与正常患者图像的4分类结果,实验结果显示分类平均准确率比现有方法提高约0.5~2个百分点。实验结果证明了该方法的有效性,为医疗专家能够准确判断脑肿瘤种类提供了新的参考。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    20. 基于深度学习的ECG信号分类
    于雁, 邱磊,
    计算机与现代化    2022, 0 (05): 16-20.  
    摘要518)      PDF(pc) (1182KB)(115)    收藏
    心电图(ECG)能够实时反映心脏状态,可用于心律失常和其它心血管疾病的准确诊断。针对ECG信号采集时的噪声干扰,重构Db6小波的4级分解量并使用巴特沃斯低通滤波实现双重去噪。将降噪后的ECG信号进行R波提取,并截取P-QRS-T波片段输入到一维改进GoogLeNet模型中进行训练。一维改进GoogLeNet是原始二维GoogLeNet的优化结构,可减少网络深度并在稀疏连接中添加最大池化层和扩张卷积加大感受野,降低计算量来提高训练性能。在MIT-BIH数据集中进行实验得到99.39%的分类准确率,比一维GoogLeNet和原始GoogLeNet分别提升了0.17个百分点和0.22个百分点,训练效率均有提升。与其他先进的技术相比,心电信号分类有了显著的改进。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    21. 红外小目标检测方法综述
    胡睿杰, 车 逗
    计算机与现代化    2023, 0 (08): 79-86.   DOI: 10.3969/j.issn.1006-2475.2023.08.013
    摘要509)      PDF(pc) (5630KB)(313)    收藏
    摘要:本文旨在对基于传统的特征提取、局部对比与现今使用广泛的深度学习的3种红外小目标检测方法进行综述,并通过对比这3种方法的前沿应用,分析其在目标检测性能、鲁棒性和实时性等方面的优势和不足。从中发现,基于特征提取的方法在简单场景下具有较好的实时性和鲁棒性,但在复杂场景下可能受限。基于局部对比方法对目标的尺寸和形状变化相对鲁棒,但对背景干扰较为敏感。基于深度学习的方法在目标检测性能方面表现出色,但需要大量数据和较大的计算资源。因此,在实际应用中,应根据具体场景需求综合考虑这些方法的优缺点,并选择合适的方法进行红外小目标检测。
    相关文章 | 多维度评价 | 评论0
    22. 基于从共现矩阵提取关联的类别型数据聚类
    关云鹏, 刘玉龙
    计算机与现代化    2022, 0 (11): 1-8.  
    摘要507)      PDF(pc) (1703KB)(113)    收藏
    类别型数据聚类被广泛应用于现实世界的不同领域中,如医学科学、计算机科学等。通常的类别型数据聚类,是在基于相异度量上进行研究,针对不同特点的数据集,聚类结果会受到数据集自身特点和噪音信息的影响。此外,基于表示学习的类别型数据聚类,实现复杂,聚类结果受到表示结果的影响较大。本文以共现矩阵为基础,提出一种可以直接考虑类别型数据原始信息关联关系的聚类方法———基于从共现矩阵提取关联的类别型数据聚类方法(CDCBCM)。共现矩阵可被看作是一种对原始数据空间中信息关联情况的汇总。本文通过计算不同对象在各个属性子空间下的共现频率值来构建共现矩阵,并从共现矩阵中去除一些噪音信息,再使用归一化切割来得到聚类结果。本文方法在16个不同领域的公开数据集中进行测试,与8种现有方法进行比较,并采用F1-score指标进行检测。实验结果表明,本文方法在7个数据集上效果最好,平均排名最高,能更好地完成对类别型数据的聚类任务。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    23. 基于改进的Transformer_decoder的增强图像描述
    林椹尠, 屈嘉欣, 罗亮
    计算机与现代化    2023, 0 (01): 7-12.  
    摘要504)      PDF(pc) (1421KB)(124)    收藏
    Transformer的解码器(Transformer_decoder)模型已被广泛应用于图像描述任务中,其中自注意力机制(Self Attention)通过捕获细粒度的特征来实现更深层次的图像理解。本文对Self Attention机制进行2方面改进,包括视觉增强注意力机制(Vision-Boosted Attention, VBA)和相对位置注意力机制(Relative-Position Attention, RPA)。视觉增强注意力机制为Transformer_decoder添加VBA层,将视觉特征作为辅助信息引入Self Attention模型中,指导解码器模型生成与图像内容更匹配的描述语义。相对位置注意力机制在Self Attention的基础上,引入可训练的相对位置参数,为输入序列添加词与词之间的相对位置关系。基于COCO2014进行实验,结果表明VBA和RPA这2种注意力机制对图像描述任务都有一定改进,且2种注意力机制相结合的解码器模型有更好的语义表述效果。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    24. 基于深度学习的短时交通流预测模型
    张龄允, 韩莹, 张凯, 卢海鹏, 丁昱杰
    计算机与现代化    2022, 0 (07): 54-60.  
    摘要497)      PDF(pc) (2733KB)(118)    收藏
    交通流预测在智能交通领域有着重要的现实意义。由于交通流数据受多种因素影响,平稳性差、随机性强,呈现出高度非线性的特征,使得交通流预测极为困难。针对短时交通流预测准确性的要求,本文提出一种基于互补集成经验模态分解(Complete Ensemble Empirical Mode Decomposition, CEEMD),并结合卷积神经网络(Convolutional Neural Networks, CNN)和长短期记忆网络(Long Short-Term Memory, LSTM)的短时交通流预测方法。模型通过CEEMD信号分解减少噪声对交通流数据预测的影响,采用CNN、LSTM充分挖掘数据的时空特征,使得模型做出更加准确的判断,从而提高神经网络的学习效率。在真实交通流数据上进行实验验证,结果表明,本文提出的模型可以有效提高交通流预测的准确性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    25. 基于BERT-BiLSTM-Attention混合模型的事件抽取方法
    魏鑫, 何小海, 滕奇志, 卿粼波, 陈洪刚
    计算机与现代化    2023, 0 (04): 26-31.  
    摘要484)      PDF(pc) (1263KB)(127)    收藏
    事件抽取是信息抽取领域中的一项基本任务,旨在从非结构化文本中将结构化信息提取出来。现有基于机器阅读理解模型的事件抽取方法大多数直接对输入文本进行触发词识别检测与分类,在一定程度上忽视了由判断输入文本是否为事件而带来的预测误差,因此,提出一种基于BERT-BiLSTM-Attention混合模型的事件抽取方法。该方法用基于BERT的机器阅读理解模型为基本框架,采用多轮问答的方式,在现有机器阅读理解模型的基础上添加事件分类检测模块,使得模型能够减少预测误差,采用BiLSTM模型与注意力机制相结合组成历史会话信息模块,更有效地将重要信息筛选出来并融合到阅读理解模型中去。在公开数据集ACE2005上进行事件抽取实验,结果表明,准确率、召回率和F1值较基础模型分别提升7.8个百分点、4.6个百分点和5.4个百分点,具有一定的优势。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    26. 基于模拟退火的扩展孤立森林异常检测算法
    王诗愉, 肖利东, 严心淳, 应文豪
    计算机与现代化    2023, 0 (01): 88-94.  
    摘要453)      PDF(pc) (1393KB)(128)    收藏
    扩展孤立森林(Extended Isolation Forest, EIF)有效解决了孤立森林(Isolation Forest, iForest)对局部异常点不敏感的问题,但EIF将轴平行的孤立条件更替为使用随机斜率的超平面,导致算法模型损失了一部分泛化能力,并由于大量的向量点乘运算增加了时间开销。针对上述情况,提出一种基于模拟退火的扩展孤立森林算法(Extended Isolation Forest based on Simulated Annealing, SA-EIF)。该算法根据每棵孤立树(Isolation Tree, iTree)对于数据集的预测结果计算每棵iTree的精度值和差异值,并基于此构建适应度函数,最终利用模拟退火算法筛选数棵检测性能较优的iTree构建集成学习模型。在ODDS 异常检测数据集中进行K折交叉验证的实验结果表明:SA-EIF算法对局部异常点敏感,较现有的EIF算法减少约20%~40% 的时间开销,提高约5%~10%的检测精度。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    27. 基于可分离结构变换的轻量级Vision Transformer
    黄延辉, 兰海, 魏宪
    计算机与现代化    2022, 0 (10): 75-81.  
    摘要448)      PDF(pc) (2702KB)(101)    收藏
    由于视觉Transformer结构模型参数量大、浮点计算次数高,使得其难以部署到终端设备上。因为注意力矩阵存在低秩瓶颈,所以模型压缩算法和注意力机制加速算法不能很好地平衡模型参数量、模型推理速度和模型性能之间的关系。为了解决上述问题,本文设计一种轻量级的ViT-SST模型用于图像分类任务。首先,通过将传统全连接层转换为可分离结构,大幅度降低模型参数量且提高了模型推理速度,保证了注意力矩阵不会因出现低秩而破坏模型表达能力;其次,提出一种基于SVD分解的克罗内克积近似分解法,可以将公开的ViT-Base模型预训练参数转换至ViT-Base-SST模型,略微缓解了ViT模型的过拟合现象并提高了模型精度。在常见公开图片数据集CIFAR系列和Caltech系列上的实验验证了本文方法优于对比方法
    参考文献 | 相关文章 | 多维度评价 | 评论0
    28. ERCUnet:一种基于U-Net改进的道路裂缝检测模型
    刘宇翔, 佘维, 沈占峰, 谭帅
    计算机与现代化    2022, 0 (07): 33-39.  
    摘要441)      PDF(pc) (3566KB)(141)    收藏
    针对传统的道路裂缝检测方法存在灵活度不高、普适性不强等问题,本文参考ResNet中的残差设计和U-Net模型的U形编码解码结构,设计一种基于U-Net改进的道路裂缝检测模型——ERCUnet。该模型以残差块为主体,针对裂缝检测优化不同深度卷积层的卷积核数量,模型中所有的残差块结构相同,模型整体结构更加整齐和简单,具有可塑性好、结构性强,残差结构不仅使特征融合更加充分,也避免了深层卷积神经网络梯度消失的问题。实验在CrackForest数据集上进行,将CrackForest的118张含标注图片按照5〖DK〗∶1的比例划分训练集和测试集,通过一系列数据增广方法,有效缓解了训练数据过少的问题。损失函数融合了交叉熵和F1分数,缓解了正负样本不均衡的问题,最终的实验结果显示ERCUnet模型参数量仅为U-Net(BN)模型的13.30%,在测试集上的查全率、查准率、F1值均达70%以上,噪声率、准确率分别为29.05%、99.01%。为证实ERCUnet的可塑性,通过修改模型参数得到ERCUnet-tiny模型,其参数量仅为U-Net(BN)模型的2.39%,在测试集上取得了与U-Net(BN)相近的效果。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    29. 基于BERT与BiGRU-CRF的交通事故文本信息提取模型
    樊海玮, 秦佳杰, 孙欢, 张丽苗, 鲁芯丝雨
    计算机与现代化    2022, 0 (05): 10-15.  
    摘要441)      PDF(pc) (936KB)(103)    收藏
    针对现存交通事故文本信息中存在的大量时间、地点、伤亡损失等关键异构数据难以有效提取,以及用静态词向量深度学习模型提取交通事故文本信息精确度较低的问题,本文利用BERT(Bidirectional Encoder Representations from Transformers)对文本字符进行动态向量映射,从数据表达源头解决一词多义、上下文依赖不充分等问题;利用BiGRU(Bi-Gate Recurrent Unit)提取文本向量化后的特征,输出高特征的文本序列;利用CRF(Conditional Random Fields)计算全局最优输出节点的概率优势,优化文本序列特征结果,提出一种基于动态字向量的BERT-BiGRU-CRF融合模型,用于交通事故文本关键信息提取。通过对比实验表明,该模型在交通事故文本信息提取中平均准确率为0.952,F1为0.925,比基于静态词向量Word2Vec模型的精确率与F1值分别提高了6.3个百分点和7.9个百分点。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    30. 基于生成对抗网络的高照度可见光图像生成
    庄文华, 唐晓刚, 张斌权, 原光明
    计算机与现代化    2023, 0 (01): 1-6.  
    摘要434)      PDF(pc) (7034KB)(130)    收藏
    为解决夜间低照度条件下目标检测准确率偏低的问题,提出一种基于循环生成对抗网络的高照度可见光图像生成方法。为提高生成器提取特征的能力,在转换器模块引入CBAM注意力模块;为避免在生成图像中产生伪影的噪声干扰,把生成器解码器的反卷积方式改为最近邻插值加卷积层的上采样方式;为了提高网络训练的稳定性,把对抗损失函数由交叉熵函数换为最小二乘函数。生成的可见光图像与红外图像、夜间可见光图像相比,在光谱信息、细节信息丰富和可视性方面取得好的优势提升,能够有效地获取目标和场景的信息。分别通过图像生成指标和目标检测指标验证该方法的有效性,其中对生成可见光图像测试得到的mAP较红外图像和真实可见光图像分别提高了11.7个百分点和30.2个百分点,可以有效提高对夜间目标的检测准确率和抗干扰能力。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    31. 基于1D-CNN-LSTM注意力网络的抽油机井故障诊断
    王磊, 张晓东, 戴欢
    计算机与现代化    2023, 0 (04): 1-6.  
    摘要432)      PDF(pc) (1482KB)(124)    收藏
    针对传统基于示功图的抽油机井故障诊断方法存在特征提取复杂、模型参数量大、诊断效率低的问题,提出一种基于1D-CNN-LSTM注意力网络的故障诊断方法。将示功图转化为载荷位移序列作为网络输入,使用一维卷积神经网络(1D-CNN)在提取序列局部特征的同时减小序列长度;考虑到序列的时序特性,进一步使用长短时记忆网络(LSTM)提取序列的时序特征;为突出关键特征影响,引入Attention机制,对故障类型相关的时序特征赋予更高的注意力权重;最后将加权特征输入全连接层,利用Softmax分类器实现故障诊断。实验结果表明,所提方法的平均准确率、精确率、召回率和F1值分别达到99.13%、99.35%、99.17%和99.25%,模型大小仅为98 kB。相比基于特征工程的方法具有更高的诊断精度和泛化能力,相比基于二维卷积神经网络(2D-CNN)模型的诊断方法,显著减少了模型参数量和训练时间,提高了故障诊断效率。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    32. 基于改进kNN算法与暂稳态特征的非侵入式负荷监测方法
    田丰, 邓晓平, 张桂青, 王保义
    计算机与现代化    2022, 0 (10): 29-35.  
    摘要428)      PDF(pc) (1558KB)(114)    收藏
    非侵入式负荷监测(Non-intrusive Load Monitoring, NILM)通过分析电力总回路的电气信息得到回路中各电器的运行数据,为用户的节能优化和电网的优化调度提供依据。现有NILM方法主要将研究重点放在提高负荷识别准确度上,模型复杂度高,难以在嵌入式设备上应用。针对上述问题,提出一种基于改进kNN算法与暂稳态特征的NILM方法。首先选择无需训练的kNN算法作为负荷识别模型,采用距离权重统计方法对kNN算法进行改进,并增加余弦相似度判断机制检验kNN算法负荷识别结果准确性;然后选择暂态特征和稳态特征作为负荷特征以提高负荷特征辨识度;最后利用实验采集数据进行验证,上述NILM方法具有良好的性能。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    33. 纠正学习策略下LightGBM-GRU模型的股票波动率预测
    石志伟, 武志峰, 张哲
    计算机与现代化    2023, 0 (01): 95-102.  
    摘要423)      PDF(pc) (1925KB)(150)    收藏
    为提高传统智能算法进行时间序列预测时的精度和解决工程数据问题时的适应性,提出一种纠正学习策略。波动性广泛应用于金融领域,对股票的波动性进行预测具有重要的价值。由于股票价格的时间序列是非线性和非平稳的,预测股票市场波动成为时间序列预测中的难点。本文通过纠正学习策略进行仿真实验,设计出LightGBM-GRU模型,以LightGBM和GRU作为基模型和纠正器,预测3年内126只来自不同行业的股票在未来10 min的波动率,根据RMSPE、MAE、MSE、RMSE等指标表明:即使经典的效果比较好的集成学习模型,也能通过纠正学习策略同时提高精度和泛化能力。本文指出在算法富集和大数据的时代,智能算法的矛盾转变为智能算法通用性有限与工程问题多样性之间的矛盾,纠正学习策略可以为数据仿真提供新思路。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    34. 基于GMS和改进最佳缝合线的视差图像拼接算法
    李四杰, 唐清善, 高英华
    计算机与现代化    2022, 0 (12): 95-101.  
    摘要419)      PDF(pc) (7870KB)(99)    收藏
    针对视差图像拼接时,拼接图像存在鬼影、亮度不均匀等问题,本文提出一种基于网格运动统计(Grid-based Motion Statistics, GMS)和改进最佳缝合线的视差图像拼接算法。算法首先利用快速特征点提取和描述(Oriented FAST and Rotated BRIEF, ORB)算法提取特征点,并采用GMS算法筛除误匹配点;然后引入HSV颜色空间和图像梯度差改进能量函数,避免缝合线穿过图像边缘;最后基于图切割法求取最佳缝合线,进行图像的梯度融合拼接。仿真实验结果表明,在图像存在较大视差的情况下,本文算法特征点匹配正确率较基于尺度特征不变(Scale Invariant Feature Transform, SIFT)算法和基于加速稳健性特征(Speeded Up Robust Features, SURF)算法最低和最高提高了2.01倍和4.73倍,图像自然度平均提高了22.6%,且拼接的图像亮度均匀、无透视畸变。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    35. 基于AU-GCN与注意力机制的微表情识别
    赵婧华, 杨秋翔
    计算机与现代化    2023, 0 (03): 48-53.  
    摘要412)      PDF(pc) (1458KB)(108)    收藏
    微表情作为一种持续时间非常短的表情,能够隐晦地将人试图压抑与隐藏的真正情感表达出来,在国家安全、司法系统、医学范畴和政治选举等有着较好的应用。但由于微表情有着数据集较少、持续时间短暂、表情幅度低等特点,在识别微表情时存在数据样本量较少、计算量较大、缺失重点特征的关注、易过拟合等困难。因此本文将针对微表情只出现在面部部分区域的特点,借助面部动作单元(Action Units, AU),对其使用加权注意力机制凸显局部特征,并且应用图卷积神经网络找到AU各个节点间的依赖关系,聚合为全局特征,用于微表情识别。实验结果表明,相较于现有方法,本文提出的方法将准确率提高至79.3%。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    36. 基于改进Dijkstra算法的防冲突最短路径规划研究
    黄翼虎, 于亚楠
    计算机与现代化    2022, 0 (08): 20-24.  
    摘要404)      PDF(pc) (781KB)(132)    收藏
    多无人机在执行作业任务时可能面临发生航迹冲突的矛盾,由此提出一种改进Dijkstra算法用来实现多无人机寻找最短且互不冲突航线的功能。在经典Dijkstra算法搜寻并对各航迹节点遍历运算的过程中,通过引入各节点的前驱节点变长回溯数组来记录各节点包含的所有前驱节点,找出各任务从起始点到达目标点所存在的全部可行的最短长度航线。再引入时间窗冲突判断模型从各任务的所有可行航线中将互不冲突的航线分离出来,一旦所有航线都冲突,则将其中一条最短航线中的冲突节点当作临时障碍点处理,通过改变回溯数组重新找出与其他任务互不冲突的一条最短航线。应用Matlab软件设计编写程序来进行算法验证,实验表明该改进算法在多无人机执行作业任务时可以规划出各任务包含的全部长度最短且互不冲突的航线,任务集合的规划效率有了明显提高。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    37. 基于YOLO v4的车辆目标检测算法
    殷远齐, 徐源, 邢远新
    计算机与现代化    2022, 0 (07): 8-14.  
    摘要396)      PDF(pc) (2959KB)(141)    收藏
    针对车辆目标检测中存在遮挡目标导致检测精度低、小目标检测效果差等问题,提出一种基于YOLO v4改进的目标检测算法YOLO v4-ASC。通过在主干提取网络尾部加入卷积块注意力模块,提升网络模型的特征表达能力;改进损失函数提升网络模型的收敛速度,利用Adam+SGDM优化方法替代原始模型优化方法SGDM,进一步提升模型检测性能。此外,利用K-Means聚类算法优化先验框尺寸大小,并合并交通场景数据集中的car、truck、bus类别为vehicle,将本文问题简化为二分类问题。实验结果表明,本文提出的YOLO v4-ASC目标检测算法在保持原算法检测速度的基础上,AP达到了70.05%,F1-score达到了71%,与原YOLO v4算法相比,AP提升了9.92个百分点,F1-score提升了9个百分点。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    38. 老年人跌倒检测技术研究综述
    王梦溪, 李峻
    计算机与现代化    2024, 0 (08): 30-36.   DOI: 10.3969/j.issn.1006-2475.2024.08.006
    摘要393)      PDF(pc) (2530KB)(230)    收藏
    随着我国老龄化程度加剧,空巢独居老人所占比重明显上升,适老化设备越来越受到人们的关注。家庭环境下,由于无人看护、年龄增加以及突发疾病等一系列客观或主观原因导致的老年人跌倒已经成为威胁老年人健康的主要原因之一。因此,实时监测老年人的居家行为,对摔倒行为及时做出检测和预警,在一定程度上可以保障老人的生命安全,降低老年人由于意外跌倒所带来的生命健康风险。本文在对近几年跌倒检测方法研究进行广泛调研的基础上,根据数据获取所使用的不同类型传感器,将跌倒检测技术主要分成2类:非视觉跌倒检测方法和视觉跌倒检测方法。总结介绍了不同跌倒检测方式的系统构成,探讨了国内外最新的相关研究成果,并对其方法特点和实际应用进行了讨论。随着近几年深度学习技术的快速蓬勃发展,本文对基于深度学习的跌倒检测方法进行了重点调研,对相关算法原理及研究成果进行了深入分析与总结。此外,本文还介绍了常用的公开跌倒检测数据集,包括它们的规模和存储格式等特性,最后本文对跌倒检测技术近年来已取得的进展和未来的发展趋势分别进行总结和展望,并提出了不同方面的合理发展建议。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    39. 电网异常业务数据检测方法综述
    白开峰, 赵宏斌, 张芸, 李妍, 崔静安, 刘千金, 杨华, 倪娜
    计算机与现代化    2023, 0 (03): 79-83.  
    摘要391)      PDF(pc) (1027KB)(103)    收藏
    智能电网概念的提出推动了电网智能化和信息化的发展,电力系统产生的各种类型的业务数据量也呈指数增长,其中产生的异常数据在很大程度上对电力数据分析和电网运行稳定性有着决定性的影响。本文对电网异常业务数据检测方法进行整理分类、分析和总结,分别介绍基于传统技术和基于人工智能技术的异常业务数据检测方法,分析和阐述每种方法的基本原理和特点,总结和展望电网异常业务数据检测所面临的挑战和未来的发展趋势,为后续研究提供一定的参考。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    40. 融合RoBERTa和特征提取的政务热线工单分类
    陈钢
    计算机与现代化    2022, 0 (06): 21-26.  
    摘要390)      PDF(pc) (1297KB)(124)    收藏
    政务热线承接了海量市民诉求,人工对工单分类耗时费力。现有工单分类方法大多基于机器学习或单一神经网络模型,难以有效理解上下文语义信息,且文本特征提取不全面。针对这一问题,本文提出一种融合RoBERTa和特征提取的政务热线工单分类方法。该方法首先通过基于RoBERTa预训练语言模型的语义编码层获取政务热线工单文本中的语义表征向量,然后通过由CNN-BiGRU-Self-Attention定义的特征提取层获取工单文本的局部特征和全局特征,并对全局特征进行处理以凸显重要性高的语义特征,最后将融合后的特征向量输入分类器来完成工单分类。实验结果表明,相较于其他基线分类方法,本文提出的方法能够取得更好的工单分类效果。
    参考文献 | 相关文章 | 多维度评价 | 评论0