摘要点击排行

    一年内发表文章 |  两年内 |  三年内 |  全部
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 一种基于BERT和池化操作的文本分类模型
    张军, 邱龙龙
    计算机与现代化    2022, 0 (06): 1-7.  
    摘要739)      PDF(pc) (948KB)(136)    收藏
    使用预训练语言模型的微调方法在以文本分类为代表的许多自然语言处理任务中取得了良好的效果,尤其以基于Transformer框架的BERT模型为典型代表。然而,BERT直接使用[CLS]对应的向量作为文本表征,没有从全局和局部考虑文本的特征,从而限制了模型的分类性能。因此,本文提出一种引入池化操作的文本分类模型,使用平均池化、最大池化以及K-MaxPooling等池化方法从BERT输出矩阵中提取文本的表征向量。实验结果表明,与原始的BERT模型相比,本文提出的引入池化操作的文本分类模型具有更好的性能,在实验的所有文本分类任务中,其准确率和F1-Score值均优于BERT模型。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    2. 基于深度学习的股票趋势预测算法
    周润佳
    计算机与现代化    2023, 0 (01): 69-73.  
    摘要701)      PDF(pc) (1263KB)(146)    收藏
    针对股票趋势预测难的问题,提出一种利用CNN和LSTM进行特征提取,并结合注意力机制和对抗训练的股票趋势预测算法——AACL(Adversarial Attentive CNN-LSTM)算法。该算法利用CNN提取股票的整体趋势信息,LSTM提取股票的短期波动信息,并通过注意力机制将多个股票联系起来,捕捉股票之间的涨跌关系。算法还引入了对抗训练,通过对数据进行干扰,提高算法的鲁棒性。为了验证算法的有效性,在KDD17、ACL18和China50这3个数据集上进行实验,并与现有的算法进行比较,实验结果表明本文提出的算法可以获得最优的预测效果。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    3. 结合注意力机制的深度神经网络综述
    皇甫晓瑛, 钱惠敏, 黄敏
    计算机与现代化    2023, 0 (02): 40-49.  
    摘要611)      PDF(pc) (2408KB)(88)    收藏
    注意力机制已成为改进神经网络学习能力的研究热点之一。鉴于注意力机制受到的广泛关注,本文旨在从注意力机制的分类、与深度神经网络的结合方式,以及在自然语言处理和计算机视觉领域的具体应用3个方面对深度神经网络中的注意力机制给出较全面的分析和阐述。具体地,分析比较了软注意力、硬注意力和自注意力这3种机制的优缺点;并分别讨论了递归神经网络和卷积神经网络中结合注意力机制的常用方式及其代表性模型结构;然后,以自然语言处理、计算机视觉领域为例,说明了其应用情况;最后,分析了注意力机制的发展趋势,期望为后续研究提供线索和方向。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    4. 基于改进YOLOv5s的道路坑洼检测算法
    白芮, 徐杨, 王彬, 张雯雯
    计算机与现代化    2023, 0 (06): 69-75.   DOI: 10.3969/j.issn.1006-2475.2023.06.012
    摘要547)      PDF(pc) (3457KB)(55)    收藏
    针对现有目标检测算法难以对道路坑洼进行精准检测、检测速度慢等问题,提出一种基于改进YOLOv5s的道路坑洼检测算法。首先在YOLOv5s主干网络中融入坐标注意力(Coordinate Attention, CA)模块,使模型不仅捕获跨通道信息,还捕获方向和位置敏感信息,有助于模型更准确地定位和识别检测对象;然后在空间金字塔池化(Spatial Pyramid Pool, SPP)模块中采用软池化SoftPool改进最大池化操作,保留更详细的特征信息;在特征融合阶段,使用基于内容的功能重组 (Content-Aware ReAssembly of Features, CARAFE)对多尺度特征融合中上采样进行改进,动态生成自适应内核,可以在一个大的感受野内聚集上下文信息;最后,使用Alpha-IoU对损失函数进行改进,提高边框回归精度。实验结果表明,改进的YOLOv5s算法在平均精度上较原始网络提高了4.6个百分点,与其他主流算法SSD、Faster R-CNN、YOLOv3、YOLOv3-tiny、YOLOv4-tiny相比检测精度有较大提升。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    5. 基于混合策略改进的鲸鱼优化算法
    李茹, 范冰冰
    计算机与现代化    2022, 0 (06): 13-20.  
    摘要510)      PDF(pc) (1185KB)(126)    收藏
    针对原始鲸鱼优化算法(WOA)收敛速度慢、全局搜索能力弱、求解精度低且易陷入局部最优等问题,提出一种混合策略来改进的鲸鱼优化算法(LGWOA)。首先将莱维飞行引入鲸鱼全局搜索的公式中,通过莱维飞行加大全局搜索步长,扩大搜索空间、提高全局搜索能力;其次,在鲸鱼螺旋上升阶段,加入一个自适应权重参数来提高算法的局部搜索能力和求解精度;最后结合遗传算法的交叉变异思想平衡算法的全局搜索和局部搜索能力,维持种群的多样性,规避陷入局部最优。通过对12个基准测试函数从2个角度进行实验对比分析,结果表明,基于混合策略改进的鲸鱼优化算法在收敛速度和求解精度上均有明显提升。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    6. 模型剪枝算法综述
    李屹, 魏建国, 刘贯伟
    计算机与现代化    2022, 0 (09): 51-59.  
    摘要508)      PDF(pc) (1096KB)(151)    收藏
    模型剪枝算法利用不同的标准或方式对深度神经网络中冗余神经元进行裁剪,在不损失模型精度的情况下对模型进行最大程度的压缩,从而可以减少存储并提升速度。首先,对模型剪枝算法的研究现状与主要研究方向进行总结并归类。主要研究方向包括剪枝的尺度、剪枝元素重要性评估的方法、剪枝的稀疏度、剪枝的理论基础及对于不同任务的剪枝等方面。然后对近年来具有代表性的剪枝算法进行详细描述。最后对此领域的研究提出未来展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    7. 基于预训练模型的关系抽取研究综述
    王浩畅, 刘如意
    计算机与现代化    2023, 0 (01): 49-57.  
    摘要503)      PDF(pc) (1190KB)(149)    收藏
    近年来随着深度学习技术的不断革新,预训练模型在自然语言处理中的应用也越来越广泛,关系抽取不再是单纯地依赖传统的流水线方法。预训练语言模型的发展已经极大地推动了关系抽取的相关研究,在很多领域已经超越了传统方法。首先简要介绍关系抽取的发展与经典预训练模型;其次总结当下常用的数据集与评测方法,并分析模型在各数据集上的表现;最后探讨关系抽取发展的挑战与未来研究趋势。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    8. 基于改进YOLOV5的火焰检测算法
    王洪义, 孔梅梅, 徐荣青
    计算机与现代化    2023, 0 (01): 103-107.  
    摘要467)      PDF(pc) (1474KB)(144)    收藏
    针对现有的火焰检测算法检测平均精度低、小目标火焰漏检率高的问题,提出一种改进YOLOV5的火焰检测算法。该算法使用Transformer Encode模块代替YOLOV5主干网络末端的CSP bottleneck模块,以增强网络捕获不同局部信息的能力,提高火焰检测的平均精度,并且在YOLOV5网络中增加CBAM注意力模块,增强网络提取图像特征的能力,对于小目标火焰能够较好地提取特征,降低小目标火焰的漏检率。将该算法在公开数据集BoWFire、Bilkent上进行实验,结果表明,改进YOLOV5网络的火焰检测平均精度更高,可达83.9%,小目标火焰漏检率更低,仅为1.6%,检测速率为34帧/s,相比于原YOLOV5网络,平均精度提升了2.4个百分点,小目标火焰漏检率降低了4.1个百分点,改进后的YOLOV5网络能够满足火焰检测的实时性和精度要求。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    9. 《平凡的世界》人物关系网络分析
    王君, 何进荣, 马乐荣
    计算机与现代化    2022, 0 (06): 32-36.  
    摘要458)      PDF(pc) (1405KB)(119)    收藏
    文学作品中人物关系网络的构建与定量分析是文学作品智能化解读的重要内容。本文以路遥先生文学作品《平凡的世界》为研究对象,利用复杂网络分析方法,对文学作品中的社交网络进行构建和分析。首先提取作品中的社交网络关系,其中小说人物对应社交网络中的节点,人物之间的关系对应社交网络的边,各章人物共同出现次数对应于边的权重,然后对构建的网络进行介数、集聚系数相关性等网络指标分析及分层聚类和链路预测。实验结果表明《平凡的世界》作品中的人物关系网络是异配网络并具有小世界特性。该研究有助于推动文学作品中人物关系网络的分析。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    10. 基于改进YOLOv5的安全帽佩戴检测
    岳衡, 黄晓明, 林明辉, 高明, 李扬, 陈凌
    计算机与现代化    2022, 0 (06): 104-108.  
    摘要450)      PDF(pc) (2508KB)(152)    收藏
    针对YOLOv5无法通过权重进行聚焦,产生更具有分辨性的特征,从而降低安全帽检测准确性的问题,使用注意力模块,并分别研究压缩激励层(Squeeze and Excitation Layer, SEL)和高效通道注意力(Efficient Channel Attention, ECA)模块。针对YOLOv5去除冗余框时采用的非极大值抑制(Non Maximum Suppression, NMS)在物体高度重叠时仅保留同类最高置信度预测框的问题,使用Soft-NMS算法保留更多的预测框,并进一步使用加权非极大值抑制(Weighted Non Maximum Suppression, WNMS)融合多次预测框信息提升预测框准确性;针对下采样带来的信息丢失问题,使用Focus模块提升检测效果;综合各个模块得到最优的FESW-YOLO算法。该算法在安全帽数据集上的mAP@0.5、mAP@0.5:0.95相较于YOLOv5分别提高了2.1个百分点、1.2个百分点,提升了安全帽监管准确性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    11. 计算机视觉下的果实目标检测算法综述
    李伟强, 王东, 宁政通, 卢明亮, 覃鹏飞
    计算机与现代化    2022, 0 (06): 87-95.  
    摘要447)      PDF(pc) (1939KB)(164)    收藏
    基于计算机视觉的果实目标检测识别是目标检测、计算机视觉、农业机器人等多学科的重要交叉研究课题,在智慧农业、农业现代化、自动采摘机器人等领域,具有重要的理论研究意义和实际应用价值。随着深度学习在图像处理领域中广泛应用并取得良好效果,计算机视觉技术结合深度学习方法的果实目标检测识别算法逐渐成为主流。本文介绍基于计算机视觉的果实目标检测识别的任务、难点和发展现状,以及2类基于深度学习方法的果实目标检测识别算法,最后介绍用于算法模型训练学习的公开数据集与评价模型性能的评价指标,且对当前果实目标检测识别存在的问题和未来可能的发展方向进行讨论。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    12. 基于改进的Transformer_decoder的增强图像描述
    林椹尠, 屈嘉欣, 罗亮
    计算机与现代化    2023, 0 (01): 7-12.  
    摘要419)      PDF(pc) (1421KB)(89)    收藏
    Transformer的解码器(Transformer_decoder)模型已被广泛应用于图像描述任务中,其中自注意力机制(Self Attention)通过捕获细粒度的特征来实现更深层次的图像理解。本文对Self Attention机制进行2方面改进,包括视觉增强注意力机制(Vision-Boosted Attention, VBA)和相对位置注意力机制(Relative-Position Attention, RPA)。视觉增强注意力机制为Transformer_decoder添加VBA层,将视觉特征作为辅助信息引入Self Attention模型中,指导解码器模型生成与图像内容更匹配的描述语义。相对位置注意力机制在Self Attention的基础上,引入可训练的相对位置参数,为输入序列添加词与词之间的相对位置关系。基于COCO2014进行实验,结果表明VBA和RPA这2种注意力机制对图像描述任务都有一定改进,且2种注意力机制相结合的解码器模型有更好的语义表述效果。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    13. 基于TasNet的单通道语音分离技术的研究综述
    陆炜, 朱定局
    计算机与现代化    2022, 0 (11): 119-126.  
    摘要414)      PDF(pc) (1016KB)(72)    收藏
    语音分离是声学信号处理中的一项基本任务,具有广泛的应用。得益于深度学习的发展,近年来单通道语音分离系统的性能有了显着提升。特别是,随着一种被称为时域音频网络(Time-domain audio separation Network,TasNet)的新语音分离方法被提出,语音分离技术的研究也逐步从基于时-频域的传统方法过渡至基于时域的方法。本文综述基于TasNet的单通道语音分离技术的研究现状与展望。在回顾基于时-频域的语音分离传统方法之后,本文重点介绍基于TasNet的Conv-TasNet模型以及DPRNN模型,并对比针对各模型的改进研究。最后,本文阐述目前基于TasNet的单通道语音分离模型的局限性,并从模型、数据集、说话人数量以及如何解决复杂场景下的语音分离等层面对未来的研究方向进行讨论。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    14. 基于从共现矩阵提取关联的类别型数据聚类
    关云鹏, 刘玉龙
    计算机与现代化    2022, 0 (11): 1-8.  
    摘要405)      PDF(pc) (1703KB)(89)    收藏
    类别型数据聚类被广泛应用于现实世界的不同领域中,如医学科学、计算机科学等。通常的类别型数据聚类,是在基于相异度量上进行研究,针对不同特点的数据集,聚类结果会受到数据集自身特点和噪音信息的影响。此外,基于表示学习的类别型数据聚类,实现复杂,聚类结果受到表示结果的影响较大。本文以共现矩阵为基础,提出一种可以直接考虑类别型数据原始信息关联关系的聚类方法———基于从共现矩阵提取关联的类别型数据聚类方法(CDCBCM)。共现矩阵可被看作是一种对原始数据空间中信息关联情况的汇总。本文通过计算不同对象在各个属性子空间下的共现频率值来构建共现矩阵,并从共现矩阵中去除一些噪音信息,再使用归一化切割来得到聚类结果。本文方法在16个不同领域的公开数据集中进行测试,与8种现有方法进行比较,并采用F1-score指标进行检测。实验结果表明,本文方法在7个数据集上效果最好,平均排名最高,能更好地完成对类别型数据的聚类任务。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    15. 基于深度学习的人体行为检测方法研究综述
    沈加炜, 陆一鸣, 陈晓艺, 钱美玲, 陆卫忠,
    计算机与现代化    2023, 0 (09): 1-9.   DOI: 10.3969/j.issn.1006-2475.2023.09.001
    摘要388)      PDF(pc) (2112KB)(88)    收藏
    当下结合计算机视觉和视频的特征提取对人体行为动作进行捕捉识别的研究炙手可热,并且其在智能视频监控和智能家居的人机交互等其他领域方向上的应用场景也十分丰富。基于传统方法的人体行为检测算法有着依赖数据样本过多、易受环境噪音影响从而降低精确率等缺点,而不断发展的深度学习技术逐渐展现出它的优势,可以很好地解决这些问题。本文基于此,首先介绍一些目前常用的行为识别数据集并在此基础上剖析当下基于深度学习的人体行为识别检测的研究现状;其次描述常见的人体行为识别检测方法及其识别的流程;最后对现存的各种行为识别检测方法性能、现存问题进行总结和未来发展方向进行展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    16. 基于生成对抗网络的高照度可见光图像生成
    庄文华, 唐晓刚, 张斌权, 原光明
    计算机与现代化    2023, 0 (01): 1-6.  
    摘要376)      PDF(pc) (7034KB)(96)    收藏
    为解决夜间低照度条件下目标检测准确率偏低的问题,提出一种基于循环生成对抗网络的高照度可见光图像生成方法。为提高生成器提取特征的能力,在转换器模块引入CBAM注意力模块;为避免在生成图像中产生伪影的噪声干扰,把生成器解码器的反卷积方式改为最近邻插值加卷积层的上采样方式;为了提高网络训练的稳定性,把对抗损失函数由交叉熵函数换为最小二乘函数。生成的可见光图像与红外图像、夜间可见光图像相比,在光谱信息、细节信息丰富和可视性方面取得好的优势提升,能够有效地获取目标和场景的信息。分别通过图像生成指标和目标检测指标验证该方法的有效性,其中对生成可见光图像测试得到的mAP较红外图像和真实可见光图像分别提高了11.7个百分点和30.2个百分点,可以有效提高对夜间目标的检测准确率和抗干扰能力。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    17. BBR拥塞控制算法延迟及带宽探测优化
    黄宏平, 朱小勇, 王志远,
    计算机与现代化    2022, 0 (10): 113-120.  
    摘要371)      PDF(pc) (2082KB)(86)    收藏
    传统基于丢包的拥塞控制算法因为其高丢包率和引发缓冲区膨胀问题已经不能满足许多应用对网络性能的要求。谷歌提出的BBR(Bottleneck Bandwidth and Round Trip)算法以其抗丢包、高带宽利用率和低延迟等特性受到广泛关注与研究。但是BBR还存在排队延迟仍然较高、在RTT(Round Trip Time)较小环境下表现不佳、带宽探测不及时等问题。本文对BBR排队延迟和收敛性进行分析,进而提出改进方法:限制在外数据包数,并根据网络反馈适时减少拥塞窗口大小来降低延迟;在RTT较小环境下,将探测RTT阶段之前的带宽估计延续到探测RTT阶段之后;设置平稳状态最长保持时间及时退出平稳周期并进入探测周期。在NS3中的仿真实验结果表明,改进BBR降低了RTT及其抖动,提高了算法的收敛速度;能够在RTT较小环境下高效利用带宽;改进BBR能够显著提高长RTT流的带宽探测频率。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    18. 基于深度学习的驾驶员分心行为识别
    何丽雯, 张锐驰
    计算机与现代化    2022, 0 (06): 67-74.  
    摘要370)      PDF(pc) (2347KB)(122)    收藏
    分心驾驶行为识别是提高驾驶安全的主要方法之一。针对分心驾驶行为识别精度低的问题,本文提出一种基于深度学习的驾驶员分心行为识别算法,由目标检测网络和行为精确识别网络级联构成。基于State Farm公开数据集,第一级利用目标检测算法SSD(Single Shot Multibox Detector)对数据集中的驾驶员原始图像进行局部信息提取,确定行为识别候选区域;第二级分别利用迁移学习VGG19、ResNet50和MobileNetV2模型对候选区域内的行为信息进行精确识别;最后,实验对比级联架构与单模型架构对分心驾驶行为的识别精度。结果表明,提出的级联网络模型相较于主流单模型检测方法,驾驶员行为识别的准确率总体上提升4~7%个百分点。该算法不仅减少噪声和其他背景区域对模型的影响,提高分心行为识别准确率,还可以有效识别更多的行为类别以避免动作的误分类。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    19. 基于深度学习的ECG信号分类
    于雁, 邱磊,
    计算机与现代化    2022, 0 (05): 16-20.  
    摘要359)      PDF(pc) (1182KB)(88)    收藏
    心电图(ECG)能够实时反映心脏状态,可用于心律失常和其它心血管疾病的准确诊断。针对ECG信号采集时的噪声干扰,重构Db6小波的4级分解量并使用巴特沃斯低通滤波实现双重去噪。将降噪后的ECG信号进行R波提取,并截取P-QRS-T波片段输入到一维改进GoogLeNet模型中进行训练。一维改进GoogLeNet是原始二维GoogLeNet的优化结构,可减少网络深度并在稀疏连接中添加最大池化层和扩张卷积加大感受野,降低计算量来提高训练性能。在MIT-BIH数据集中进行实验得到99.39%的分类准确率,比一维GoogLeNet和原始GoogLeNet分别提升了0.17个百分点和0.22个百分点,训练效率均有提升。与其他先进的技术相比,心电信号分类有了显著的改进。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    20. 基于可分离结构变换的轻量级Vision Transformer
    黄延辉, 兰海, 魏宪
    计算机与现代化    2022, 0 (10): 75-81.  
    摘要353)      PDF(pc) (2702KB)(80)    收藏
    由于视觉Transformer结构模型参数量大、浮点计算次数高,使得其难以部署到终端设备上。因为注意力矩阵存在低秩瓶颈,所以模型压缩算法和注意力机制加速算法不能很好地平衡模型参数量、模型推理速度和模型性能之间的关系。为了解决上述问题,本文设计一种轻量级的ViT-SST模型用于图像分类任务。首先,通过将传统全连接层转换为可分离结构,大幅度降低模型参数量且提高了模型推理速度,保证了注意力矩阵不会因出现低秩而破坏模型表达能力;其次,提出一种基于SVD分解的克罗内克积近似分解法,可以将公开的ViT-Base模型预训练参数转换至ViT-Base-SST模型,略微缓解了ViT模型的过拟合现象并提高了模型精度。在常见公开图片数据集CIFAR系列和Caltech系列上的实验验证了本文方法优于对比方法
    参考文献 | 相关文章 | 多维度评价 | 评论0
    21. ERCUnet:一种基于U-Net改进的道路裂缝检测模型
    刘宇翔, 佘维, 沈占峰, 谭帅
    计算机与现代化    2022, 0 (07): 33-39.  
    摘要352)      PDF(pc) (3566KB)(115)    收藏
    针对传统的道路裂缝检测方法存在灵活度不高、普适性不强等问题,本文参考ResNet中的残差设计和U-Net模型的U形编码解码结构,设计一种基于U-Net改进的道路裂缝检测模型——ERCUnet。该模型以残差块为主体,针对裂缝检测优化不同深度卷积层的卷积核数量,模型中所有的残差块结构相同,模型整体结构更加整齐和简单,具有可塑性好、结构性强,残差结构不仅使特征融合更加充分,也避免了深层卷积神经网络梯度消失的问题。实验在CrackForest数据集上进行,将CrackForest的118张含标注图片按照5〖DK〗∶1的比例划分训练集和测试集,通过一系列数据增广方法,有效缓解了训练数据过少的问题。损失函数融合了交叉熵和F1分数,缓解了正负样本不均衡的问题,最终的实验结果显示ERCUnet模型参数量仅为U-Net(BN)模型的13.30%,在测试集上的查全率、查准率、F1值均达70%以上,噪声率、准确率分别为29.05%、99.01%。为证实ERCUnet的可塑性,通过修改模型参数得到ERCUnet-tiny模型,其参数量仅为U-Net(BN)模型的2.39%,在测试集上取得了与U-Net(BN)相近的效果。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    22. 基于CNN-Transformer混合结构的遥感影像变化检测模型
    许叶彤, 耿信哲, 赵伟强, 张 月, 宁海龙, 雷 涛
    计算机与现代化    2023, 0 (07): 79-85.   DOI: 10.3969/j.issn.1006-2475.2023.07.014
    摘要352)      PDF(pc) (2633KB)(68)    收藏
    卷积神经网络和Transformer模型的出现,使得遥感影像变化检测技术不断进步,但是目前这2种方法仍存在不足:一方面,卷积神经网络由于其卷积核局部感知的特点无法对遥感影像进行全局信息建模;另一方面,Transformer虽然可以捕获遥感影像的全局信息,但是对影像变化的细节信息不能很好地建模,且其计算复杂度随图像的分辨率呈二次方增长。为了解决上述问题,获得更稳健的变化检测结果,本文提出一种基于卷积神经网络和Transformer混合结构的变化检测模型(CNN-Transformer Change Detection Network, CTCD-Net)。首先,CTCD-Net串联使用卷积神经网络和基于Transformer编解码结构来有效地编码遥感影像的局部特征和全局特征,从而提升网络的特征学习能力。其次,提出跨通道的Transformer自注意力模块(CSA)和注意力前馈网络(A-FFN),有效地降低了Transformer的计算复杂度。在LEVIR-CD和CDD数据集上进行了充分的实验,实验结果表明,CTCD-Net的检测精确度显著优于目前其他主流方法。
    相关文章 | 多维度评价 | 评论0
    23. 一种基于CBAM和改进通道注意力的EfficientNet的混合脑肿瘤分类方法
    华昕宇, 祁云嵩
    计算机与现代化    2023, 0 (05): 1-7.  
    摘要352)      PDF(pc) (1818KB)(53)    收藏
    为进一步提高脑肿瘤影像诊断的准确性和稳健性,提出一种基于CBAM(Convolutional Block Attention Module)和改进通道注意力机制的EfficientNet神经网络(IC+IEffxNet)的新型混合脑肿瘤分类方法。该方法分为2个阶段,第一阶段由基于改进空间注意力机制的CBAM模型提取特征。第二阶段将EfficientNet架构中的Squeeze and Excitation(SE)块替换成Efficient Channel Attention (ECA)块,将第一阶段的组合特征输出作为第二阶段的输入。实验展示了在混合脑肿瘤MRI数据集下,神经胶质瘤患者、脑膜瘤患者、脑垂体瘤患者与正常患者图像的4分类结果,实验结果显示分类平均准确率比现有方法提高约0.5~2个百分点。实验结果证明了该方法的有效性,为医疗专家能够准确判断脑肿瘤种类提供了新的参考。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    24. 基于BERT-BiLSTM-Attention混合模型的事件抽取方法
    魏鑫, 何小海, 滕奇志, 卿粼波, 陈洪刚
    计算机与现代化    2023, 0 (04): 26-31.  
    摘要329)      PDF(pc) (1263KB)(75)    收藏
    事件抽取是信息抽取领域中的一项基本任务,旨在从非结构化文本中将结构化信息提取出来。现有基于机器阅读理解模型的事件抽取方法大多数直接对输入文本进行触发词识别检测与分类,在一定程度上忽视了由判断输入文本是否为事件而带来的预测误差,因此,提出一种基于BERT-BiLSTM-Attention混合模型的事件抽取方法。该方法用基于BERT的机器阅读理解模型为基本框架,采用多轮问答的方式,在现有机器阅读理解模型的基础上添加事件分类检测模块,使得模型能够减少预测误差,采用BiLSTM模型与注意力机制相结合组成历史会话信息模块,更有效地将重要信息筛选出来并融合到阅读理解模型中去。在公开数据集ACE2005上进行事件抽取实验,结果表明,准确率、召回率和F1值较基础模型分别提升7.8个百分点、4.6个百分点和5.4个百分点,具有一定的优势。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    25. 纠正学习策略下LightGBM-GRU模型的股票波动率预测
    石志伟, 武志峰, 张哲
    计算机与现代化    2023, 0 (01): 95-102.  
    摘要328)      PDF(pc) (1925KB)(87)    收藏
    为提高传统智能算法进行时间序列预测时的精度和解决工程数据问题时的适应性,提出一种纠正学习策略。波动性广泛应用于金融领域,对股票的波动性进行预测具有重要的价值。由于股票价格的时间序列是非线性和非平稳的,预测股票市场波动成为时间序列预测中的难点。本文通过纠正学习策略进行仿真实验,设计出LightGBM-GRU模型,以LightGBM和GRU作为基模型和纠正器,预测3年内126只来自不同行业的股票在未来10 min的波动率,根据RMSPE、MAE、MSE、RMSE等指标表明:即使经典的效果比较好的集成学习模型,也能通过纠正学习策略同时提高精度和泛化能力。本文指出在算法富集和大数据的时代,智能算法的矛盾转变为智能算法通用性有限与工程问题多样性之间的矛盾,纠正学习策略可以为数据仿真提供新思路。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    26. 基于YOLO v4的车辆目标检测算法
    殷远齐, 徐源, 邢远新
    计算机与现代化    2022, 0 (07): 8-14.  
    摘要325)      PDF(pc) (2959KB)(119)    收藏
    针对车辆目标检测中存在遮挡目标导致检测精度低、小目标检测效果差等问题,提出一种基于YOLO v4改进的目标检测算法YOLO v4-ASC。通过在主干提取网络尾部加入卷积块注意力模块,提升网络模型的特征表达能力;改进损失函数提升网络模型的收敛速度,利用Adam+SGDM优化方法替代原始模型优化方法SGDM,进一步提升模型检测性能。此外,利用K-Means聚类算法优化先验框尺寸大小,并合并交通场景数据集中的car、truck、bus类别为vehicle,将本文问题简化为二分类问题。实验结果表明,本文提出的YOLO v4-ASC目标检测算法在保持原算法检测速度的基础上,AP达到了70.05%,F1-score达到了71%,与原YOLO v4算法相比,AP提升了9.92个百分点,F1-score提升了9个百分点。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    27. 基于深度学习的短时交通流预测模型
    张龄允, 韩莹, 张凯, 卢海鹏, 丁昱杰
    计算机与现代化    2022, 0 (07): 54-60.  
    摘要321)      PDF(pc) (2733KB)(91)    收藏
    交通流预测在智能交通领域有着重要的现实意义。由于交通流数据受多种因素影响,平稳性差、随机性强,呈现出高度非线性的特征,使得交通流预测极为困难。针对短时交通流预测准确性的要求,本文提出一种基于互补集成经验模态分解(Complete Ensemble Empirical Mode Decomposition, CEEMD),并结合卷积神经网络(Convolutional Neural Networks, CNN)和长短期记忆网络(Long Short-Term Memory, LSTM)的短时交通流预测方法。模型通过CEEMD信号分解减少噪声对交通流数据预测的影响,采用CNN、LSTM充分挖掘数据的时空特征,使得模型做出更加准确的判断,从而提高神经网络的学习效率。在真实交通流数据上进行实验验证,结果表明,本文提出的模型可以有效提高交通流预测的准确性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    28. 基于GMS和改进最佳缝合线的视差图像拼接算法
    李四杰, 唐清善, 高英华
    计算机与现代化    2022, 0 (12): 95-101.  
    摘要318)      PDF(pc) (7870KB)(78)    收藏
    针对视差图像拼接时,拼接图像存在鬼影、亮度不均匀等问题,本文提出一种基于网格运动统计(Grid-based Motion Statistics, GMS)和改进最佳缝合线的视差图像拼接算法。算法首先利用快速特征点提取和描述(Oriented FAST and Rotated BRIEF, ORB)算法提取特征点,并采用GMS算法筛除误匹配点;然后引入HSV颜色空间和图像梯度差改进能量函数,避免缝合线穿过图像边缘;最后基于图切割法求取最佳缝合线,进行图像的梯度融合拼接。仿真实验结果表明,在图像存在较大视差的情况下,本文算法特征点匹配正确率较基于尺度特征不变(Scale Invariant Feature Transform, SIFT)算法和基于加速稳健性特征(Speeded Up Robust Features, SURF)算法最低和最高提高了2.01倍和4.73倍,图像自然度平均提高了22.6%,且拼接的图像亮度均匀、无透视畸变。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    29. 基于双层规划的容器云资源动态配置算法
    周永福, 徐胜超
    计算机与现代化    2022, 0 (12): 1-5.  
    摘要314)      PDF(pc) (924KB)(86)    收藏
    本文分析容器云资源动态配置决策问题,通过定义容器云资源的调度任务,求解得到容器云资源调度时间;利用容器云资源调度任务的最短时间矩阵,获取容器云资源调度所需的条件。在双层规划条件下,求解容器云资源调度的目标函数和约束函数;考虑到用户的任务情况和云数据中心的云资源状况,在虚拟机上构建一个到物理主机的矩阵,通过构建容器云资源动态配置结果在优化时的目标函数,结合约束条件,实现容器云资源的动态配置。实验结果表明,资源动态配置算法不仅可以提高容器云资源的利用率,还可以减少配置完成时间,具有更好的动态配置性能。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    30. 基于模拟退火的扩展孤立森林异常检测算法
    王诗愉, 肖利东, 严心淳, 应文豪
    计算机与现代化    2023, 0 (01): 88-94.  
    摘要313)      PDF(pc) (1393KB)(86)    收藏
    扩展孤立森林(Extended Isolation Forest, EIF)有效解决了孤立森林(Isolation Forest, iForest)对局部异常点不敏感的问题,但EIF将轴平行的孤立条件更替为使用随机斜率的超平面,导致算法模型损失了一部分泛化能力,并由于大量的向量点乘运算增加了时间开销。针对上述情况,提出一种基于模拟退火的扩展孤立森林算法(Extended Isolation Forest based on Simulated Annealing, SA-EIF)。该算法根据每棵孤立树(Isolation Tree, iTree)对于数据集的预测结果计算每棵iTree的精度值和差异值,并基于此构建适应度函数,最终利用模拟退火算法筛选数棵检测性能较优的iTree构建集成学习模型。在ODDS 异常检测数据集中进行K折交叉验证的实验结果表明:SA-EIF算法对局部异常点敏感,较现有的EIF算法减少约20%~40% 的时间开销,提高约5%~10%的检测精度。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    31. 基于改进kNN算法与暂稳态特征的非侵入式负荷监测方法
    田丰, 邓晓平, 张桂青, 王保义
    计算机与现代化    2022, 0 (10): 29-35.  
    摘要311)      PDF(pc) (1558KB)(91)    收藏
    非侵入式负荷监测(Non-intrusive Load Monitoring, NILM)通过分析电力总回路的电气信息得到回路中各电器的运行数据,为用户的节能优化和电网的优化调度提供依据。现有NILM方法主要将研究重点放在提高负荷识别准确度上,模型复杂度高,难以在嵌入式设备上应用。针对上述问题,提出一种基于改进kNN算法与暂稳态特征的NILM方法。首先选择无需训练的kNN算法作为负荷识别模型,采用距离权重统计方法对kNN算法进行改进,并增加余弦相似度判断机制检验kNN算法负荷识别结果准确性;然后选择暂态特征和稳态特征作为负荷特征以提高负荷特征辨识度;最后利用实验采集数据进行验证,上述NILM方法具有良好的性能。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    32. 基于HMRF的改进Kmeans脑肿瘤分割算法
    马瑜涓, 韩建宁, 史韶杰, 曹尚斌, 杨志秀
    计算机与现代化    2023, 0 (03): 1-5.  
    摘要310)      PDF(pc) (1147KB)(76)    收藏
    为了解决磁共振成像脑部肿瘤区域出现误识别及对脑MRI图像中的肿瘤部位分割时出现的不确定性等问题,提出一种改进的Kmeans算法与隐马尔可夫随机场模型(HMRF)相结合的分割方法,对脑肿瘤图像实现精准分割。首先将Kmeans算法的欧氏距离替换成曼哈顿-切比雪夫距离并用改进后的Kmeans算法对待分割图像进行初始参数估计和初始分割,然后通过HMRF理论获得图像的空间信息,并结合EM算法对聚类中心进行更新,获得更为准确的聚类中心,从而提高算法的分割性能。实验结果表明,该方法具有良好的脑部肿瘤分割性能效果,其中Dice系数和Jaccard系数的平均值分别达到了0.9289和0.8725。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    33. 基于1D-CNN-LSTM注意力网络的抽油机井故障诊断
    王磊, 张晓东, 戴欢
    计算机与现代化    2023, 0 (04): 1-6.  
    摘要305)      PDF(pc) (1482KB)(72)    收藏
    针对传统基于示功图的抽油机井故障诊断方法存在特征提取复杂、模型参数量大、诊断效率低的问题,提出一种基于1D-CNN-LSTM注意力网络的故障诊断方法。将示功图转化为载荷位移序列作为网络输入,使用一维卷积神经网络(1D-CNN)在提取序列局部特征的同时减小序列长度;考虑到序列的时序特性,进一步使用长短时记忆网络(LSTM)提取序列的时序特征;为突出关键特征影响,引入Attention机制,对故障类型相关的时序特征赋予更高的注意力权重;最后将加权特征输入全连接层,利用Softmax分类器实现故障诊断。实验结果表明,所提方法的平均准确率、精确率、召回率和F1值分别达到99.13%、99.35%、99.17%和99.25%,模型大小仅为98 kB。相比基于特征工程的方法具有更高的诊断精度和泛化能力,相比基于二维卷积神经网络(2D-CNN)模型的诊断方法,显著减少了模型参数量和训练时间,提高了故障诊断效率。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    34. 基于LZO的Hadoop文件归档优化方法
    张军, 苏文浩
    计算机与现代化    0, (): 1-6.   DOI: 10.3969/j.issn.1006-2475.2023.06.001
    摘要291)      PDF(pc) (948KB)(42)    收藏
    Hadoop分布式框架被广泛应用于各行业大数据处理领域,但在存储大量小文件时会产生更多的元数据信息,导致名称节点的内存占用过多,影响其对外提供高性能和高并发访问的能力。对小文件进行归档存储,是有效解决该问题的常用方案。同时,考虑到数据压缩可有效减少数据存储空间大小与网络数据传输负载,本文提出一种基于实时无损压缩算法LZO的Hadoop文件归档优化方法LA(LZO-Archive)。该方法先对小文件进行归档合并,在索引文件生成阶段融合LZO压缩算法,减少索引文件的生成时间。同时,设计一种文件压缩存储算法,对数据文件和索引文件进行压缩存储,有效减少了数据所占用的数据节点磁盘空间大小和名称节点内存空间占用大小。实验结果表明,相对于原始的HDFS数据存储方法、基准的文件归档方法HAR以及对比方法LHF,本文提出的LA方法在文件归档时间、名称节点内存占用、数据节点磁盘空间占用、文件访问时间等方面表现更好。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    35. 基于CWGAN-GP与CNN的轴承故障诊断方法
    江 蕾, 唐 建, 杨超越, 吕婷婷
    计算机与现代化    2023, 0 (07): 1-6.   DOI: 10.3969/j.issn.1006-2475.2023.07.001
    摘要288)      PDF(pc) (2107KB)(49)    收藏
    摘要:针对在实际工作过程中轴承故障样本数偏少且不均衡的问题,提出一种基于条件Wasserstein生成对抗网络(CWGAN-GP)和卷积神经网络(CNN)的轴承故障诊断方法。首先,通过结合条件生成对抗网络(CGAN)和基于梯度惩罚Wasserstein距离的生成对抗网络(WGAN-GP),构建CWGAN-GP生成对抗网络;然后,将少量轴承故障的数据样本输入CWGAN-GP中,以得到与原始样本相似的高质量样本,待网络达到纳什均衡时将生成样本和原始样本混合,产生新的样本集;最后,将新样本集输入卷积神经网络学习样本特征进行故障诊断。实验结果表明,本文提出的诊断方法准确度超过99%,高于其他诊断方法,有效提高了诊断精度,增强了其泛化能力。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    36. 基于AU-GCN与注意力机制的微表情识别
    赵婧华, 杨秋翔
    计算机与现代化    2023, 0 (03): 48-53.  
    摘要288)      PDF(pc) (1458KB)(72)    收藏
    微表情作为一种持续时间非常短的表情,能够隐晦地将人试图压抑与隐藏的真正情感表达出来,在国家安全、司法系统、医学范畴和政治选举等有着较好的应用。但由于微表情有着数据集较少、持续时间短暂、表情幅度低等特点,在识别微表情时存在数据样本量较少、计算量较大、缺失重点特征的关注、易过拟合等困难。因此本文将针对微表情只出现在面部部分区域的特点,借助面部动作单元(Action Units, AU),对其使用加权注意力机制凸显局部特征,并且应用图卷积神经网络找到AU各个节点间的依赖关系,聚合为全局特征,用于微表情识别。实验结果表明,相较于现有方法,本文提出的方法将准确率提高至79.3%。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    37. 基于生成对抗网络的图像动漫化
    翟慧聪, 张明, 邓星, 王利群
    计算机与现代化    2022, 0 (07): 21-26.  
    摘要283)      PDF(pc) (3547KB)(100)    收藏
    动漫风格的图像具有高度的简化和抽象等特征,为了解决将现实世界图像转化成动漫风格图像这一问题,提出一种基于生成对抗网络的图像动漫化方法。本文的生成网络是类U-Net的全卷积结构,对输入图像先下采样,并加上浅层的特征用双线性插值的方法进行上采样,判别网络则采用Patch GAN加谱归一化的结构,分别计算语义内容损失和风格损失以提高网络的稳定性。本文采用surface表征损失、structure表征损失和texture表征损失代替风格损失,使得生成动漫图像的效果更可控。写实图像选用train2014,人脸图像采用CelebA-HQ数据集。使用本文模型在这些数据集上进行实验,实验结果表明,本文模型能够有效地完成图像动漫化的过程,并生成较高质量的动漫化图像。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    38. 基于大规模MIMO的散射信道估计技术
    史清林, 刘丽哲, 李行健
    计算机与现代化    2022, 0 (12): 18-25.  
    摘要281)      PDF(pc) (2360KB)(79)    收藏
    随着用户对通信速率的要求日益增长,散射通信的通信容量亟待提升。大规模多输入多输出(MIMO)技术是提升容量的一种重要途径,本文研究基于大规模MIMO的对流层散射通信系统的信道估计问题。首先建立基于二维均匀方形天线阵列的大规模MIMO对流层散射信道模型,其次提出一种信道协方差矩阵估计算法对传统最小均方差(MMSE)信道估计算法进行改进,最后与最小二乘(LS)、传统MMSE算法和理想MMSE信道估计算法的准确度进行对比。仿真结果表明:在信噪比(SNR)为0~25 dB的情况下,传统的MMSE算法的准确度相较于LS算法的提升效果并不明显,与理想MMSE算法的准确度有一定差距;但改进MMSE信道估计算法的准确性优于传统MMSE算法,同等条件下NMSE相同时,其SNR可提升3~5 dB,并随着SNR的增大逐渐逼近理想MMSE算法。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    39. 基于改进PSO-TrICP算法的点云配准
    梁正友, 王璐, 李轩昂, 杨锋,
    计算机与现代化    2022, 0 (05): 90-95.  
    摘要280)      PDF(pc) (1109KB)(90)    收藏
    针对传统迭代最近点(Iterative Closest Point, ICP)算法在初始空间位置偏差大时,容易陷入局部最优的问题,提出一种基于改进PSO-TrICP算法的点云配准方法。首先,对传统粒子群(Particle Swarm Optimization, PSO)算法进行改进,引入适应度的相似度测量准则调整粒子的更新方式,然后加入历次迭代的全局最优解的均值作为新的学习因子避免求解过程中出现“早熟”现象;其次用刚性变换参数和点云间的重叠率组成粒子,利用改进PSO算法为配准提供良好的初始相对位置;最后,通过裁剪迭代最近点(Trimmed Iterative Closest Point, TrICP)算法估计点云间的空间变换。实验结果表明,改进PSO-TrICP算法的配准精度与运行效率优于近年提出的同类配准算法,且具有较好的鲁棒性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    40. 基于自注意力机制和单导联心电信号的自动睡眠分期算法#br#
    栗伟松, 汤敏芳, 何征岭, 王鹏, 杜利东, 方震, 陈贤祥
    计算机与现代化    2022, 0 (12): 50-59.  
    摘要279)      PDF(pc) (2610KB)(77)    收藏
    基于手工标记或传统机器学习方法实现睡眠分期过程复杂且效率低下,深度神经网络因其强大的提取复杂特征的能力改善了睡眠分期结果,但仍存在忽略片段内部信息相关性的问题。针对此问题,本文提出一种基于自注意力机制和单导联心电信号的自动睡眠分期算法,利用卷积模块、双向门控循环单元及自注意力机制实现特征自动提取与分类。在开源睡眠心脏健康研究数据库(SHHS1、SHHS2)、动脉粥样硬化的多民族研究数据库(MESA)和美国麻省理工的多导睡眠数据库(MITBPD)中分别选取1000、1000、1000和16名受试者的单导联心电信号数据进行训练和测试,得到模型睡眠四分类(觉醒、快速眼动期、浅睡眠和深睡眠)结果,分类准确率分别达到75.77%(kappa=0.63)、81.01%(kappa=066)、82.79%(kappa=0.71)和76.22%(kappa=0.58),优于基于传统机器学习算法的睡眠分期结果,验证了提出模型的有效性。
    参考文献 | 相关文章 | 多维度评价 | 评论0