计算机与现代化

Select

1. 基于改进YOLOv5s的道路坑洼检测算法

白芮, 徐杨, 王彬, 张雯雯

计算机与现代化 2023, 0 (06): 69-75. DOI: 10.3969/j.issn.1006-2475.2023.06.012

摘要（757）

PDF（pc）（3457KB）（129）

针对现有目标检测算法难以对道路坑洼进行精准检测、检测速度慢等问题,提出一种基于改进YOLOv5s的道路坑洼检测算法。首先在YOLOv5s主干网络中融入坐标注意力（Coordinate Attention, CA）模块,使模型不仅捕获跨通道信息,还捕获方向和位置敏感信息,有助于模型更准确地定位和识别检测对象;然后在空间金字塔池化（Spatial Pyramid Pool, SPP）模块中采用软池化SoftPool改进最大池化操作,保留更详细的特征信息;在特征融合阶段,使用基于内容的功能重组（Content-Aware ReAssembly of Features, CARAFE）对多尺度特征融合中上采样进行改进,动态生成自适应内核,可以在一个大的感受野内聚集上下文信息;最后,使用Alpha-IoU对损失函数进行改进,提高边框回归精度。实验结果表明,改进的YOLOv5s算法在平均精度上较原始网络提高了4.6个百分点,与其他主流算法SSD、Faster R-CNN、YOLOv3、YOLOv3-tiny、YOLOv4-tiny相比检测精度有较大提升。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

2. 基于深度学习的人体行为检测方法研究综述

沈加炜, 陆一鸣, 陈晓艺, 钱美玲, 陆卫忠,

计算机与现代化 2023, 0 (09): 1-9. DOI: 10.3969/j.issn.1006-2475.2023.09.001

摘要（685）

PDF（pc）（2112KB）（229）

当下结合计算机视觉和视频的特征提取对人体行为动作进行捕捉识别的研究炙手可热，并且其在智能视频监控和智能家居的人机交互等其他领域方向上的应用场景也十分丰富。基于传统方法的人体行为检测算法有着依赖数据样本过多、易受环境噪音影响从而降低精确率等缺点，而不断发展的深度学习技术逐渐展现出它的优势，可以很好地解决这些问题。本文基于此，首先介绍一些目前常用的行为识别数据集并在此基础上剖析当下基于深度学习的人体行为识别检测的研究现状；其次描述常见的人体行为识别检测方法及其识别的流程；最后对现存的各种行为识别检测方法性能、现存问题进行总结和未来发展方向进行展望。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

3. 基于多模态特征融合的抑郁症识别

谷明轩, 范冰冰

计算机与现代化 2023, 0 (10): 17-22. DOI: 10.3969/j.issn.1006-2475.2023.10.003

摘要（626）

PDF（pc）（1213KB）（333）

抑郁症是一种常见的精神疾病，现有的抑郁症诊断主要依赖于抑郁量表和精神科医生的访谈，具有较强的主观性。近年来，越来越多的研究者致力于通过脑电特征或音频特征识别抑郁症患者，但并未有研究将脑电信息与音频信息有效地结合起来，忽略了音频和脑电数据之间的相关性。因此本文提出一种基于全连接神经网络的多模态特征融合模型，通过对音频模态和脑电模态信息的特征融合提升抑郁症识别的准确率，为抑郁症的识别提供新的角度和方法。实验表明，多模态特征融合在MODMA数据集上的抑郁症识别准确率达到了81.58%且高于单模态抑郁症识别方法的准确率。这表明，相比于单模态识别，多模态特征融合模型能够提高抑郁症识别的准确率。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

4. 基于CNN-Transformer混合结构的遥感影像变化检测模型

许叶彤, 耿信哲, 赵伟强, 张月, 宁海龙, 雷涛

计算机与现代化 2023, 0 (07): 79-85. DOI: 10.3969/j.issn.1006-2475.2023.07.014

摘要（603）

PDF（pc）（2633KB）（173）

卷积神经网络和Transformer模型的出现，使得遥感影像变化检测技术不断进步，但是目前这2种方法仍存在不足：一方面，卷积神经网络由于其卷积核局部感知的特点无法对遥感影像进行全局信息建模；另一方面，Transformer虽然可以捕获遥感影像的全局信息，但是对影像变化的细节信息不能很好地建模，且其计算复杂度随图像的分辨率呈二次方增长。为了解决上述问题，获得更稳健的变化检测结果，本文提出一种基于卷积神经网络和Transformer混合结构的变化检测模型（CNN-Transformer Change Detection Network， CTCD-Net）。首先，CTCD-Net串联使用卷积神经网络和基于Transformer编解码结构来有效地编码遥感影像的局部特征和全局特征，从而提升网络的特征学习能力。其次，提出跨通道的Transformer自注意力模块（CSA）和注意力前馈网络（A-FFN），有效地降低了Transformer的计算复杂度。在LEVIR-CD和CDD数据集上进行了充分的实验，实验结果表明，CTCD-Net的检测精确度显著优于目前其他主流方法。

相关文章 | 多维度评价 | 评论（0）

Select

5. 一种基于CBAM和改进通道注意力的EfficientNet的混合脑肿瘤分类方法

华昕宇, 祁云嵩

计算机与现代化 2023, 0 (05): 1-7.

摘要（520）

PDF（pc）（1818KB）（106）

为进一步提高脑肿瘤影像诊断的准确性和稳健性，提出一种基于CBAM（Convolutional Block Attention Module）和改进通道注意力机制的EfficientNet神经网络（IC+IEffxNet）的新型混合脑肿瘤分类方法。该方法分为2个阶段，第一阶段由基于改进空间注意力机制的CBAM模型提取特征。第二阶段将EfficientNet架构中的Squeeze and Excitation（SE）块替换成Efficient Channel Attention （ECA）块，将第一阶段的组合特征输出作为第二阶段的输入。实验展示了在混合脑肿瘤MRI数据集下，神经胶质瘤患者、脑膜瘤患者、脑垂体瘤患者与正常患者图像的4分类结果，实验结果显示分类平均准确率比现有方法提高约0.5~2个百分点。实验结果证明了该方法的有效性，为医疗专家能够准确判断脑肿瘤种类提供了新的参考。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

6. 红外小目标检测方法综述

胡睿杰, 车逗

计算机与现代化 2023, 0 (08): 79-86. DOI: 10.3969/j.issn.1006-2475.2023.08.013

摘要（509）

PDF（pc）（5630KB）（313）

摘要：本文旨在对基于传统的特征提取、局部对比与现今使用广泛的深度学习的3种红外小目标检测方法进行综述，并通过对比这3种方法的前沿应用，分析其在目标检测性能、鲁棒性和实时性等方面的优势和不足。从中发现，基于特征提取的方法在简单场景下具有较好的实时性和鲁棒性，但在复杂场景下可能受限。基于局部对比方法对目标的尺寸和形状变化相对鲁棒，但对背景干扰较为敏感。基于深度学习的方法在目标检测性能方面表现出色，但需要大量数据和较大的计算资源。因此，在实际应用中，应根据具体场景需求综合考虑这些方法的优缺点，并选择合适的方法进行红外小目标检测。

相关文章 | 多维度评价 | 评论（0）

Select

7. 老年人跌倒检测技术研究综述

王梦溪, 李峻

计算机与现代化 2024, 0 (08): 30-36. DOI: 10.3969/j.issn.1006-2475.2024.08.006

摘要（393）

PDF（pc）（2530KB）（230）

随着我国老龄化程度加剧，空巢独居老人所占比重明显上升，适老化设备越来越受到人们的关注。家庭环境下，由于无人看护、年龄增加以及突发疾病等一系列客观或主观原因导致的老年人跌倒已经成为威胁老年人健康的主要原因之一。因此，实时监测老年人的居家行为，对摔倒行为及时做出检测和预警，在一定程度上可以保障老人的生命安全，降低老年人由于意外跌倒所带来的生命健康风险。本文在对近几年跌倒检测方法研究进行广泛调研的基础上，根据数据获取所使用的不同类型传感器，将跌倒检测技术主要分成2类：非视觉跌倒检测方法和视觉跌倒检测方法。总结介绍了不同跌倒检测方式的系统构成，探讨了国内外最新的相关研究成果，并对其方法特点和实际应用进行了讨论。随着近几年深度学习技术的快速蓬勃发展，本文对基于深度学习的跌倒检测方法进行了重点调研，对相关算法原理及研究成果进行了深入分析与总结。此外，本文还介绍了常用的公开跌倒检测数据集，包括它们的规模和存储格式等特性，最后本文对跌倒检测技术近年来已取得的进展和未来的发展趋势分别进行总结和展望，并提出了不同方面的合理发展建议。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

8. 基于CWGAN-GP与CNN的轴承故障诊断方法

江蕾, 唐建, 杨超越, 吕婷婷

计算机与现代化 2023, 0 (07): 1-6. DOI: 10.3969/j.issn.1006-2475.2023.07.001

摘要（382）

PDF（pc）（2107KB）（126）

摘要：针对在实际工作过程中轴承故障样本数偏少且不均衡的问题，提出一种基于条件Wasserstein生成对抗网络（CWGAN-GP）和卷积神经网络（CNN）的轴承故障诊断方法。首先，通过结合条件生成对抗网络（CGAN）和基于梯度惩罚Wasserstein距离的生成对抗网络（WGAN-GP），构建CWGAN-GP生成对抗网络；然后，将少量轴承故障的数据样本输入CWGAN-GP中，以得到与原始样本相似的高质量样本，待网络达到纳什均衡时将生成样本和原始样本混合，产生新的样本集；最后，将新样本集输入卷积神经网络学习样本特征进行故障诊断。实验结果表明，本文提出的诊断方法准确度超过99%，高于其他诊断方法，有效提高了诊断精度，增强了其泛化能力。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

9. 基于改进YOLOv5的小目标检测方法

王艺成, 张国良, 张自杰,

计算机与现代化 2023, 0 (05): 100-105.

摘要（376）

PDF（pc）（2253KB）（78）

为了解决传统YOLOv5目标检测算法在检测小目标时存在检测精度不高和漏检的问题，提出一种基于改进YOLOv5的小目标检测方法。首先，为了使Anchor Box能更好地适应小目标，在K-means聚类过程中，使用IOU（Interp Over Union）替换原始使用的欧几里得距离公式，重新定义Anchor Box和Ground Truth之间的距离；其次，在空间金字塔池化（Spatial Pyarmid Pooling， SPP）上增加一个池化核大小为3×3的最大池化，提高对小目标的检测精度；最后，制作一个包含多种小型目标的数据集以验证算法性能。实验结果表明：改进YOLOv5算法的验证平均精度（mean Average Precision， mAP）达到76.92%，与经典YOLOv5算法相比提升了3.56个百分点，检测效果有所提升且能检测出漏检目标。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

10. 基于LZO的Hadoop文件归档优化方法

张军, 苏文浩

计算机与现代化 0, (): 1-6. DOI: 10.3969/j.issn.1006-2475.2023.06.001

摘要（369）

PDF（pc）（948KB）（69）

Hadoop分布式框架被广泛应用于各行业大数据处理领域,但在存储大量小文件时会产生更多的元数据信息,导致名称节点的内存占用过多,影响其对外提供高性能和高并发访问的能力。对小文件进行归档存储,是有效解决该问题的常用方案。同时,考虑到数据压缩可有效减少数据存储空间大小与网络数据传输负载,本文提出一种基于实时无损压缩算法LZO的Hadoop文件归档优化方法LA（LZO-Archive）。该方法先对小文件进行归档合并,在索引文件生成阶段融合LZO压缩算法,减少索引文件的生成时间。同时,设计一种文件压缩存储算法,对数据文件和索引文件进行压缩存储,有效减少了数据所占用的数据节点磁盘空间大小和名称节点内存空间占用大小。实验结果表明,相对于原始的HDFS数据存储方法、基准的文件归档方法HAR以及对比方法LHF,本文提出的LA方法在文件归档时间、名称节点内存占用、数据节点磁盘空间占用、文件访问时间等方面表现更好。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

11. 区块链安全保护研究综述

查凯金, 王志波, 何月顺, 徐洪珍

计算机与现代化 2023, 0 (06): 110-117. DOI: 10.3969/j.issn.1006-2475.2023.06.018

摘要（367）

PDF（pc）（1274KB）（114）

区块链技术作为当前最热门的技术之一有着巨大的应用价值,同时也因国家高度支持而广泛应用于许多关键领域。区块链技术的诸多特性决定了其在数据共享、数字存证、信息溯源及安全保障等方面的应用优势,但同时也存在一些安全隐患。因此,本文研究国内外区块链安全保护相关的高质量文献,对区块链的基础架构、安全威胁以及隐私保护方案等内容和相关研究进展进行总结。并就区块链隐私保护技术的发展现状,从加密技术改进和隐私保护技术融合研究2个方面分析其对区块链发展的影响。希望为区块链安全保护研究提供参考。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

12. 战略战役兵棋多级多分辨率网格模型建模方法

李海燕, 吴大愚, 柳强

计算机与现代化 2023, 0 (06): 27-32. DOI: 10.3969/j.issn.1006-2475.2023.06.005

摘要（343）

PDF（pc）（1273KB）（99）

网格模型是战略战役兵棋环境模型的核心组成部分,对兵棋行为模型产生直接作用和影响。构建多级多分辨率的网格模型,是扩展战略战役兵棋、支持细粒度环境模型和关键战术行动的基础。由此,结合军事需求与技术需求,提出一种面向战略战役兵棋的基于球面剖分的多级多分辨率网格模型。首先,利用等经纬度四角格进行网格剖分;然后,定义多层级等经纬度网格坐标系簇及相关要素;最后,给出该网格模型的应用实例,对比分析其与单一分辨率六角格模型在网格数量和描述粒度方面的特性,体现多级多分辨率网格模型在提升环境模型粒度上具有明显的优点。该方法能够支持开展宏观和微观不同粒度兵棋仿真推演的需求,并满足兵棋系统对运行效率和环境仿真多分辨率的要求。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

13. 基于D3QN的交通灯控制优化

张国有, 宋世峰

计算机与现代化 2023, 0 (07): 30-35. DOI: 10.3969/j.issn.1006-2475.2023.07.006

摘要（342）

PDF（pc）（1524KB）（107）

交通灯在控制路口车辆通行上起着至关重要的作用。现阶段城市路口的交通灯多采用固定配时、固定相位变换的控制策略，难以满足不同的车流情况。设计出能够根据路口车流情况实时调整交通灯变换的控制方案成为智能交通领域的研究热点之一。而城市路口车流具有动态变化性，难以直接对其展开研究。为了设计一种合适的交通灯动态控制方案，本文引入深度强学习技术。将十字路口交通灯控制问题抽象成强化学习模型，采用D3QN算法对该模型进行求解。在此基础上综合考虑处于不同状态的车辆，改进状态输入和奖励函数。最终在交通模拟器SUMO上进行不同车流下的仿真实验。实验结果表明，模型训练趋于稳定后，改进奖励函数和状态输入的D3QN算法的平均队列长度在3种车流量下对比传统的固定控制策略和自适应控制策略均有明显提升，对比DQN和DDQN算法也有一定的优化，控制效果更佳。

相关文章 | 多维度评价 | 评论（0）

Select

14. 基于知识增强的方面级情感分析方法

李诗月, 孟佳娜, 于玉海, 李雪莹, 许英傲

计算机与现代化 2023, 0 (10): 1-8. DOI: 10.3969/j.issn.1006-2475.2023.10.001

摘要（332）

PDF（pc）（2224KB）（152）

方面级情感分析能够准确判断出句子中方面词的情感极性，在社交、电子商务等领域发挥着重要的作用。现有的方法大多通过序列表示或者注意力机制建模上下文和目标词间的关系，忽略了文本的背景知识以及方面词之间的概念链接，导致学习到的语义关系不够充分。针对上述问题，提出一种基于知识增强的方面级情感分析模型（Aspect Based Sentiment Analysis Model Based on Knowledge Enhancement， ABSA-KE）。首先，通过预训练模型BERT提取特征并得到对应的词向量，并使用解析器获取文本对应的依存关系树，利用BiLSTM和图注意力网络联合建模来学习节点嵌入表示并获得文本向量；其次，使用外部知识库引入不同语境下的方面词知识向量来增强方面级情感分析模型；最后，进行情感分类任务。通过与已有模型对比的实验结果表明，本文所提出的模型在方面级情感分析任务上是有效且合理的。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

15. 基于改进EfficientNet的阿尔兹海默症图像分类

朱剑波, 葛明锋, 董文飞

计算机与现代化 2023, 0 (06): 56-61. DOI: 10.3969/j.issn.1006-2475.2023.06.010

摘要（327）

PDF（pc）（2105KB）（126）

为提升卷积神经网络用于阿尔兹海默症MRI图像分类的效果,提出一种融合自适应注意力机制和数据增强技术的卷积神经网络FAMENET。通过引入数据增强技术和Focal Loss损失函数缓解数据不平衡现象;重构优化主干网络 EfficientNet,在保持精度的情况下减少模型参数量和网络的计算量;引入自适应注意力机制,解决输入图片进行特征提取下采样过程导致的信息丢失问题。在公开数据集进行大量对比实验,FAMENET的分类准确率达到79.95%,AUC值达到82.54%,设计的消融实验也充分证明了所提出的各个模块和网络的有效性。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

16. 基于FCGA-LSTM与迁移学习的天然气负荷预测

张志霞, 谢宝强

计算机与现代化 2023, 0 (07): 7-12. DOI: 10.3969/j.issn.1006-2475.2023.07.002

摘要（308）

PDF（pc）（1521KB）（114）

摘要：高精度的天然气负荷预测对天然气管网的平稳高效运行具有重要意义。现有天然气负荷预测方法大多是基于历史数据充足条件的，而对缺少历史数据地区天然气负荷预测问题研究很少。针对此类问题，本文提出一种模糊编码遗传算法（FCGA）优化的长短时记忆（LSTM）神经网络与迁移学习结合的天然气短期负荷预测方法。首先选定源域与目标域，利用源域的大量历史负荷数据构建FCGA-LSTM预测模型，进行模型训练与测试后将源域模型整体迁移至缺少数据的目标域，接着利用目标域少量数据对模型进行参数微调及二次训练，最终得到目标域负荷预测模型。以西安某新建小区为例验证，结果显示，基于FCGA-LSTM与迁移学习的预测方法相比于LSTM加迁移学习组合方法、非迁移学习下LSTM，预测精度分别提高15.6个百分点与35.2个百分点，表明了模型的有效性。本文方法对缺少历史数据的新建城区天然气负荷预测具有一定指导作用。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

17. 密集障碍环境下的改进DWA避障算法

邓云峥, 黄翼虎

计算机与现代化 2023, 0 (07): 48-53. DOI: 10.3969/j.issn.1006-2475.2023.07.009

摘要（307）

PDF（pc）（2726KB）（119）

针对传统动态窗口法（DWA）算法在密集障碍环境中容易绕行障碍物区域和避障性差等问题，提出一种基于A*的改进DWA算法。首先在A*算法的评价函数中引入偏移代价来引导算法快速朝目标方向搜索，改善规划效率低的问题，并对路径点进行优化得到全局最优路径点。其次在DWA算法中通过障碍物方位和距离动态调整评价函数各项权值，解决算法在密集障碍环境的避障性差问题。最后融入全局最优路径点，确保改进DWA算法能够在实现实时避障的同时保证路径最优。仿真结果显示，相比于其他2种算法，改进DWA算法可以有效提高机器人在密集障碍环境下的避障性，路径长度和行进步数均可降低15%以上，且能够有效躲避随机障碍物，安全性更高，鲁棒性更强。

相关文章 | 多维度评价 | 评论（0）

Select

18. 手势识别与交互综述

魏嘉焜, 王家润

计算机与现代化 2024, 0 (08): 67-76. DOI: 10.3969/j.issn.1006-2475.2024.08.012

摘要（299）

PDF（pc）（1322KB）（204）

手势识别与交互技术是人机交互技术与人工智能技术前沿研究的基石任务。该任务以计算机和设备协同工作识别、处理手势信息并给出与手势相对应的机器操作为主要目标，融合应用了动作捕捉、图像处理、图像分类、多端协同交互工作等多项技术，是支撑指挥控制系统、机器人交互、医疗操作等当下前沿智能交互工作与人机交互工作的有力保障。目前，手势识别与交互的相关研究已经日渐成熟，应用领域广泛、应用场景丰富。本文主要对手势识别与交互的相关技术和硬件发展做出综述。首先，全面梳理手势识别与交互技术的研究进展，同时对手势识别的关键步骤进行归类描述；其次，分类阐述用于三维手势交互的当前主流手势识别深度传感器的相关工作；随后，对三维手势识别的真实感识别技术进行剖析和讨论；最后，分析手势识别与交互技术中存在的不足与亟待改进的问题，提出融合深度学习、模式识别等前沿技术与有可行性的研究思路和方法，对该领域未来的研究方向、技术发展和应用领域做出预测和展望。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

19. 未知协议状态机推断技术研究综述

盛嘉杰, 牛胜杰, 陈阳, 方伟青, 张玉杰, 李鹏, 胡素君

计算机与现代化 2023, 0 (05): 58-67.

摘要（296）

PDF（pc）（2194KB）（89）

协议逆向工程（PRE）描述了协议的行为逻辑，一般分为协议格式提取和状态机构造2个步骤。这2个步骤既相互关联又相互独立，在网络安全领域具有重要意义。本文全面梳理PRE协议状态机推理的相关文献，总结分析协议状态机推理的研究现状和发展趋势。首先，本文介绍PRE的形式化定义和基本原则，并讨论主要领域的具体要求。其次，分析状态机推理方法，并将其分为3种模式：聚类方法、状态相关方法和轮询状态实体方法，然后从不同的角度比较算法的逆向能力和时间效率。最后展望协议状态机推理的发展趋势。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

20. 基于3D-SIFT与4PCS融合的大数据量点云快速配准方法

李家乐1, 李哲润1, 赵勇2, 张杨1

计算机与现代化 2024, 0 (02): 1-6. DOI: 10.3969/j.issn.1006-2475.2024.02.001

摘要（292）

PDF（pc）（1952KB）（537）

摘要：测量点云与模型点云的配准是视觉定位的关键。针对测量点云数据量大且与CAD模型点云重叠率低造成视觉定位精度差、算法效率低的问题，提出一种基于三维尺度不变特征变换（3D-SIFT）与4点快速鲁棒匹配算法（4PCS）融合的测量点云与模型点云配准方法。首先利用深度相机对零件进行点云提取并对提取到的测量点云进行降噪和滤波处理；接着利用3D-SIFT特征点提取算法对测量点云和CAD模型点云进行特征点提取；最后把提取的特征点作为4PCS算法的初始值进行2种点云数据的配准。与常用的4PCS算法、Super-4PCS算法相比，在算法仿真与实际应用实验结果表明，本文算法在保证配准精度的前提下将配准速度提高30%以上。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

21. 融合注意力机制的非对称深度监督哈希

王欣怡, 尹四清, 洪军

计算机与现代化 2023, 0 (05): 26-31.

摘要（288）

PDF（pc）（5364KB）（69）

随着大数据时代的到来，互联网上的信息数据呈指数级增长。在这些数据中，图像资源占比巨大，因此如何在海量图像中进行准确而高效的图像检索成为当今的重要研究课题之一。目前大多数方法提取到的特征信息含有大量冗余信息，使得在图像检索中不能有效关注到图像的重点区域而导致检索性能差、准确度低等问题。基于以上不足，本文提出一种融合注意力机制的非对称深度哈希算法。以卷积神经网络为基础，对现有的由语义特征引导的混合注意力机制进行改进，将其嵌入进网络中，使得哈希网络将全局语义信息和局部语义信息共同分析。同时设计新的量化函数来减少量化误差，从而增强哈希编码的特征表达能力。并采用mAP作为评价指标，在数据集CIFAR-10和NUS-WIDE数据集上将本文方法与其他哈希方法进行比较，结果表明本文设计的网络模型能很好地结合全局和局部的特征信息，提高图像检索性能。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

22. 基于CA-TransUNet的遥感图像道路分割

龚轩, 郭中华, 陈旺

计算机与现代化 2023, 0 (07): 112-118. DOI: 10.3969/j.issn.1006-2475.2023.07.019

摘要（284）

PDF（pc）（2025KB）（108）

针对在背景复杂、地物信息丰富的光学遥感图像中分割道路时存在漏判、误判的问题，提出一种基于CA-TransUNet的遥感图像道路分割方法。以含有多头自注意力的语义分割网络TransUNet为基准，在特征提取模块融入空洞空间金字塔池化，获得不同视野的特征图，通过对各通道信息的整合，增强对多尺度特征的提取；在级联的上采样模块加入混合注意力机制，减少上采样过程细节信息损失，抑制对无关边界信息的注意，并增强道路特征；选择Dice损失函数和二元交叉熵损失联合优化，使光学遥感图像的道路分割更加准确。实验结果表明，提出方法在DeepGlobe数据集上获得的IoU值和F1指数中分别达到56.53%、71.48%，准确率高达97.32%，均高于其他经典遥感图像道路分割算法。在分割周边背景复杂、受障碍物遮挡和细窄道路等情况的遥感图像时，改进的算法能够有效地进行道路分割。

相关文章 | 多维度评价 | 评论（0）

Select

23. 改进YOLOv5算法的遥感图像车辆检测

朱理清, 李祥,

计算机与现代化 2023, 0 (05): 117-121.

摘要（283）

PDF（pc）（2658KB）（56）

针对遥感图像中背景复杂目标、车辆小导致的成像模糊的目标漏检问题，提出一种基于YOLOv5s的改进模型。改进模型设计一种新的主干网络结构：改进模型的主干特征提取选用RepVGG网络，同时在主干网络中加入注意力机制CoordAttention来提高模型小目标的感知能力。增加多尺度特征融合，提高改进模型对于小目标的检测精度，边框回归的损失函数选择使用DIoU，帮助改进模型实现更加精准定位。实验结果表明，改进后的YOLOv5模型在遥感图像的目标检测，相较于原始模型在小目标车辆中检测精度提升5.3个百分点，与Faster R-CNN相比mAP提升16.88个百分点。改进后的模型与主流的检测算法相比能有较大的检测精度提升，相较于原始的YOLOv5s模型在遥感图像小车辆检测有更好的检测精度。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

24. 基于YOLOv5s的遥感图像的车辆小目标检测

邱地发, 于淑芳, 刘锦辉, 毕梦昭

计算机与现代化 2023, 0 (05): 122-126.

摘要（282）

PDF（pc）（1941KB）（61）

由于YOLOv5s检测效果好、计算复杂度低而被广泛应用于各类目标检测任务，但是其过大的下采样步长导致对卫星遥感图像中的车辆小目标检测难以获得满意的结果。为了提升对小目标检测的性能，基于YOLOv5s采取降低下采样步长的策略以保护车辆小目标的纹理和几何特性，同时在检测头前插入注意力机制模块以抑制复杂背景对目标的干扰。在0.5 m/pixel分辨率的自建数据集上进行测试，提出的SA-YOLOv5s对车辆目标检测的AP、Recall、Precision值分别达到90.1%、89%和 87.3%，与YOLOv5s相比分别提升了16.4、6和5个百分点，表现出良好的检测性能。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

25. 基于DTW-TCN的股票分类及预测研究

孙子雨, 任燃, 魏曦哲

计算机与现代化 2023, 0 (08): 31-37. DOI: 10.3969/j.issn.1006-2475.2023.08.006

摘要（282）

PDF（pc）（8512KB）（140）

摘要：随着社会以及信息技术的发展，金融工具、股票交易呈现出新的形态，其中，由于金融数据量呈指数级增长，股票类数据难以分类与预测，因此在高频交易中股票趋势预测尤为重要。为提高高频交易中股票趋势预测的精准度，构建基于动态时间规整（DTW）聚类分析的时间卷积神经网络（TCN）模型用于股票分类和预测研究。在本文模型（DTW-TCN）中，采用开盘价、最高价、最低价、收盘价、成交量、成交额作为股票特征变量。为避免量级影响，首先，对特征向量标准化处理，随后利用动态时间规整对于时间序列相似性的衡量作用，作为股票的分类标准；然后，通过TCN卷积神经网络提取类别共同特征进行网络训练，进一步，将类别中的普遍性行业股票利用训练好的卷积神经网络进行股票趋势预测；最终，得到所属类别股票每分钟开盘价与收盘价走势，并与实际趋势相对比进行误差分析。以19只行业代表性股票分钟级数据为样本进行实验，结果表明，本文模型能有效地分类趋势趋同的股票，并且实现在分钟级别高频交易中准确进行趋势预测，对比传统时间序列模型和LSTM网络模型具有更大时间特性优势。未来DTW-TCN分类预测模型可以用于更多大数据信息分类和预测实例中。

相关文章 | 多维度评价 | 评论（0）

Select

26. 面向工业互联网平台的商用密码改造

莫严, 唐容川, 鞠昊, 孙绍飞, 王安

计算机与现代化 2023, 0 (06): 118-126. DOI: 10.3969/j.issn.1006-2475.2023.06.019

摘要（281）

PDF（pc）（6846KB）（74）

工业互联网是关键信息基础设施的重要一环, 其信息安全问题至关重要, 商用密码是保障工业互联网信息安全的重要手段。本文提出一种将商用密码应用于汉云工业互联网平台的基本架构, 给出一种对工业互联网平台物理层、基础设施即服务层、平台即服务层、软件即服务层、设备层、控制层进行密码应用升级改造的解决方案, 用于解决信息安全管理方面以及信息安全技术方面的种种安全问题, 并将该架构应用到工业界实际项目的落地过程。该密码应用升级改造架构与汉云工业互联网大数据平台以及徐工重型车联网平台现有业务架构进行对接和改造, 将原平台设备与符合国家有关标准要求的商用密码产品的兼容适配攻关, 实现了对汉云工业互联网大数据平台和徐工重型车联网平台的密码应用升级改造, 展现了该架构的广泛适用性和可持续发展潜力。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

27. 基于通道注意力和Transformer的图像标题生成方法

刘静, 陈金广

计算机与现代化 2023, 0 (05): 8-12.

摘要（278）

PDF（pc）（10305KB）（80）

图像标题生成是指通过计算机将图像翻译成描述该图像的标题语句。针对现有图像标题生成任务中，未充分利用图像的局部和全局特征以及时间复杂度较高的问题，本文提出一种基于卷积神经网络（Convolution Neural Networks， CNN）和Transformer的混合结构图像标题生成模型。考虑卷积网络所具有的空间和通道特性，首先将轻量化高精度的注意力ECA与卷积网络CNN进行融合构成注意力残差块，用于从输入图像中提取视觉特征；然后将特征输入到序列模型Transformer中，在编码器端借助自注意学习来获得所参与的视觉表示，在语言解码器中捕获标题中的细粒度信息以及学习标题序列间的相互作用，进而结合视觉特征逐步得到图像所对应的标题描述。将模型在MSCOCO数据集上进行实验，BLEU-1、BLEU-3、BLEU-4、Meteor和CIDEr指标分别提高了0.3、0.5、0.7、0.4、1.6个百分点。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

28. 个性化新闻推荐系统研究综述及探讨

翟梅

计算机与现代化 2024, 0 (04): 12-20. DOI: 10.3969/j.issn.1006-2475.2024.04.003

摘要（272）

PDF（pc）（1534KB）（198）

摘要：随着新闻媒体技术的快速发展，网络新闻数量呈指数级增长。为了解决网络信息过载的问题，个性化新闻推荐扮演着极其关键的角色。它通过学习用户的浏览行为、兴趣爱好等信息，主动为用户提供感兴趣的新闻，从而提高用户的阅读体验。个性化新闻推荐逐渐成为新闻领域及计算机科学领域的研究热点和实践难题，业界专家已提出多种推荐算法用于提高推荐系统的性能。本文系统阐述个性化新闻推荐的国内外最新研究现状和进展，首先，简要介绍新闻推荐系统的架构，并对新闻推荐系统中核心推荐算法和常用评价指标进行研究。虽然个性化新闻推荐给用户带来很好的体验，但是潜移默化中也给用户带来很多未知的影响。跟其他新闻推荐综述不同的是，本文还结合新闻媒体专业研究了当前新闻推荐系统对用户行为产生的影响及面临的问题。最后，根据当前遇到的问题提出个性化新闻推荐的研究方向及未来工作重点。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

29. 基于改进YOLOv5s的太阳能电池缺陷检测算法

罗伟, 刘思远, 徐健祥, 董天培

计算机与现代化 2023, 0 (07): 119-126. DOI: 10.3969/j.issn.1006-2475.2023.07.020

摘要（268）

PDF（pc）（2142KB）（134）

太阳能电池生产制造的过程中，由于制造工艺的不完善和人为操作失误等原因可能导致太阳能电池片出现破损、裂缝、断栅和硅材料缺失等类型的缺陷。为了提高太阳能电池缺陷检测准确率，本文提出一种基于YOLOv5s算法的太阳能电池缺陷检测算法YOLOv5s-CG。在主干网络和特征融合层不同位置引入卷积注意力机制（CBAM），主干网络的注意力机制关注全局信息，特征融合层的注意力机制关注局部信息，同时在空间和通道2种维度上进行特征增强，并用GIOU损失函数评估检测效果。使用重新标注的公开太阳能电池数据集对提出的算法进行实验验证，实验结果表明，YOLOv5s-CG算法的全类平均精度（mAP）达到了75.1%，与YOLOv5s算法比较，各种类型的缺陷检测精度都有所提升，其中裂缝和硅材料缺失的精度分别提升了0.036、0.033，全类平均精度（mAP）提高了0.026；与主流的目标检测算法SSD相比，全类平均精度（mAP）提升了0.123。本文算法能够更加高效地检测太阳能电池的缺陷，为实际生产提供更好的检测算法。

相关文章 | 多维度评价 | 评论（0）

Select

30. 基于多特征提取的时间卷积知识追踪模型

谢仕斌, 刘梦赤, 唐诗琪, 周瑞平,

计算机与现代化 2023, 0 (07): 25-29. DOI: 10.3969/j.issn.1006-2475.2023.07.005

摘要（264）

PDF（pc）（2268KB）（100）

知识追踪（Knowledge Tracing， KT）是教育数据挖掘领域中的关键技术，其通过利用学生的历史学习记录来预测学生下一次的作答表现。针对基于时间卷积网络（TCN）的深度知识追踪模型存在的只使用学生答题序列和答题结果，而忽略学生其他行为特征的问题，本文提出一种基于多特征提取的时间卷积知识追踪模型TKT-PCA。使用时间卷积网络和主成分分析（Principal Component Analysis， PCA）方法自动提取多种学生作答行为中的隐藏特征并学习它们的表示，不仅降低了特征维度减少冗余信息，还充分评估了学生的知识掌握情况。实验结果表明，与其他知识追踪基线模型相比，TKT-PCA有更好的预测性能。

相关文章 | 多维度评价 | 评论（0）

Select

31. 融合FGM和指针标注的实体关系联合抽取方法

刘玉鹏, 葛艳, 杜军威, 陈卓

计算机与现代化 2023, 0 (11): 1-5. DOI: 10.3969/j.issn.1006-2475.2023.11.001

摘要（264）

PDF（pc）（1192KB）（147）

摘要：实体关系联合抽取是信息抽取的一项重要任务。由于传统的实体关系联合抽取方法把实体之间的关系建模为离散类型，因此不能很好地解决重叠三元组的问题。为了解决难以抽取重叠三元组的问题，本文提出一种融合FGM和指针标注的实体关系联合抽取BERT-FGM模型。该模型将实体之间的关系建模为函数，通过在BERT训练词向量的过程中融入FGM提高模型的鲁棒性。模型首先通过指针标注策略抽取头实体，然后将头实体与句子向量进行融合作为一个新向量，最终将其在预定义的关系条件下抽取头实体对应的尾实体。实验使用的是公开数据集WebNLG，实验结果表明该模型F1值达到90.7%，有效地解决了三元组重叠问题。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

32. 融合Hits改进算法的意见领袖挖掘方法

王柳, 朱义鑫, 韩莉英

计算机与现代化 2023, 0 (06): 39-42. DOI: 10.3969/j.issn.1006-2475.2023.06.007

摘要（259）

PDF（pc）（1065KB）（68）

微博逐渐成为舆论传播的重要载体,网络舆情中的意见领袖在舆情传播过程中发挥着推动作用,挖掘微博中的意见领袖对于管理社交网络舆情十分必要。综合考虑微博用户在网络中的转发评论等行为,构建微博用户“转发-评论”双层网络,通过引入用户交互行为的影响力贡献因子以及权重因子挖掘用户的影响力,提出基于Hits改进算法构建微博用户影响力评估算法。实验结果表明,该模型的F-score综合指标得分优于PageRank算法、Hits算法,能够更加准确地识别微博社区话题中的意见领袖,有效计算微博用户的实际影响力,更加准确有效地识别出微博社区某一话题中的意见领袖,为社交网络治理及网络舆情管理等方面提供参考。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

33. 面向无人机群组的高效愈合密钥管理方案

刘军, 袁霖, 冯志尚, 张彪, 刘超

计算机与现代化 2023, 0 (06): 103-109. DOI: 10.3969/j.issn.1006-2475.2023.06.017

摘要（257）

PDF（pc）（1878KB）（73）

无人机群组网络（Unmanned Aerial Vehicle Group Network, UAVGN）具有动态拓扑和高移动性,在开放的空中无线环境容易遭受到安全威胁和攻击,尤其通信传输链路被干扰,通信出现不稳定甚至中断情况,导致密钥管理过程出现丢失密钥数据包,后续无法建立密钥安全通信。为此,结合无人机资源有限性提出一种基于Hash链和中国剩余定理（Chinese Remainder Theorem, CRT）的愈合组密钥管理方案,具有自愈和互愈2种机制,提高了无人机密钥更新的灵活性和效率。同时,将群组密钥更新分为本地更新密钥和会话更新密钥,本地更新密钥通过提前预置的Hash函数在本地完成更新,进一步降低密钥更新计算开销,提高无人机节点密钥处理能力;会话更新密钥由密钥组管理器（Key Group Manager, KGM）根据会话阶段选取密钥更新因子,利用中国剩余定理构造密钥更新广播消息进行密钥分发更新,实现密钥动态灵活更新。通过分析与实验表明,方案具有前后向安全、抗撤销能力、抗共谋攻击、抗重放攻击等安全性能,在相同条件下与现有方案比较,本文方案有效优化了计算和通信开销,提高了密钥更新效率,能够解决无人机群组通信不稳定情况的密钥更新问题,确保无人机群组建立密钥安全通信。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

34. 基于改进LSTM算法的锂电池SOC估计

潘思源, 张伟

计算机与现代化 2023, 0 (08): 25-30. DOI: 10.3969/j.issn.1006-2475.2023.08.005

摘要（255）

PDF（pc）（3576KB）（137）

摘要：针对锂电池荷电状态（State of charge， SOC）估计精度低的问题，提出一种基于改进的LSTM算法建立神经网络模型方法，得到电压和电流输入与SOC输出之间的映射关系。并通过拓展卡尔曼滤波器滤除输出估计值的噪声，增强了模型的稳定性。在神经网络模型建模过程中采用改进的粒子群算法对神经元个数、学习率、步长等超参数进行优化，进一步提高了锂电池SOC的估计效率和准确性。最后，采用马里兰大学CALCE数据集中的DST工况数据进行模型训练，使用FUDS、US06工况数据集，对改进的LSTM算法与CNN-LSTM、GRU以及CatBoost等算法进行对比实验。实验结果表明改进后的LSTM算法估计模型具有较高的稳定度与准确性，验证了改进方案的可行性。

相关文章 | 多维度评价 | 评论（0）

Select

35. 基于小样本学习的藏文命名实体识别

于韬, 张英, 拥措,

计算机与现代化 2023, 0 (05): 13-19.

摘要（252）

PDF（pc）（1601KB）（59）

藏文命名实体识别是藏文自然语言处理领域的一项关键技术，其目的是识别文本中的人名、地名及组织机构名。在目前的研究中，深度学习方法需要大量的标注数据是制约模型性能的主要因素，因此本文提出基于小样本学习的藏文命名实体识别方法。针对小样本数据量少导致模型无法充分学习实体特征的问题，本文提出实体特征信息融合方法，在训练过程中将实体位置信息、分词信息与藏文音节信息以维度拼接的方式进行特征融合，通过辅助信息增强实体特征，使得模型可以较好地学习藏文长实体的边界信息，并设计消融实验探究不同特征信息对模型效果的影响。实验结果表明，本文提出的方法有效提高了藏文小样本命名实体识别模型的准确率，相较于基线实验F1值总体提升了22.22~38个百分点。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

36. 基于ICEEMDAN-BiLSTM-ARIMA组合模型的桥梁健康监测数据预测模型#br#

李世佳, 侯丽娟, 汤斌, 杨柳, 刘恒,

计算机与现代化 2023, 0 (07): 36-42. DOI: 10.3969/j.issn.1006-2475.2023.07.007

摘要（250）

PDF（pc）（3187KB）（89）

针对目前桥梁结构健康监测系统所采集的各个类型的时序数据，鉴于桥梁结构响应及环境给数据所产生的附加影响，为实现桥梁结构安全预警，基于集成算法原理，本文采用目前经验模态分解方法中的改进，研究改进的带有自适应噪声的完备集合经验模式分解（Improved Complete Ensemble Empirical Mode Decomposition with Adaptive Noise， ICEEMDAN）方法，对桥梁监测应力数据进行分解，并通过多尺度排列熵算法将分解后的各个分量进行排序并重组，最后结合经典时序分析理论双向长短期记忆网络（Bidirectional Long Short-Term Memory， BiLSTM）与差分自回归移动平均模型（Autoregressive Integrated Moving Average Model， ARIMA）对重组后的分量进行预测分析并组合其结果得到最终的预测值。通过对雅康高速大渡河特大桥健康监测系统所采集的应力数据进行验证，结果表明，该方法相比于单一模型有效地提高了预测效果，整体提升约60%~70%。实现对桥梁监测数据的准确预测，为未来桥梁结构的健康状态预估、数字化建设以及安全预警奠定了有力的基础。

相关文章 | 多维度评价 | 评论（0）

Select

37. 基于轻量化YOLOv5的安全帽检测

李延满, 王必恒, 赵羚焱

计算机与现代化 2023, 0 (10): 59-64. DOI: 10.3969/j.issn.1006-2475.2023.10.009

摘要（250）

PDF（pc）（5102KB）（135）

配电网运维施工安全智能监控系统中存在大量数据，客观上要求算法具有较高实时性。基于此，本文轻量化改进YOLOv5算法，具体包括改进K-means算法聚类锚框，采用Hard-swish激活函数和CRD损失函数，同时在主干网融合ShuffleNet结构以及FPN模块增加Attention机制。该模型SNAM-YOLOv5 （ShuffleNet and Attention Mechanism-You Only Look Once version 5）能够显著提高小目标和遮挡目标的检测性能以及处理速度。在基于海思Hi3559A嵌入式平台进行安全帽检测的运行结果表明，该模型优于同类算法，同时具有良好的实时性。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

38. 基于特征融合的海马体分割

陈嘉敏, 张伯泉, 麦海鹏

计算机与现代化 2023, 0 (08): 1-6. DOI: 10.3969/j.issn.1006-2475.2023.08.001

摘要（249）

PDF（pc）（1332KB）（109）

摘要：针对现有海马体分割算法无法对目标区域进行精确分割的问题，利用编解码结构研究一种基于特征融合的海马体分割模型。首先利用Resnet34作为模型特征编码层提取更丰富的语义特征；其次在编解码过渡层引入基于混合扩张卷积的ASPP模块以获取多尺度特征信息。最后使用注意力特征融合机制作为编解码层间的连接层以有效结合深层特征与浅层特征，为后续分割提供海马体区域位置信息，提高模型分割性能。实验在ADNI数据集上进行以验证提出模型的有效性，所研究网络模型IoU、DICE、精确率、召回率4个评价指标上分别达到了84.67%、88.51%、87.90%和89.01%。与现有先进医学分割算法进行实验对比，也表明了该模型有更好的分割能力，达到了较好的海马体图像自动分割效果。

相关文章 | 多维度评价 | 评论（0）

Select

39. 基于LoRA高效微调通用语言大模型的文本立场检测

韩霄龙, 曾曦, 刘锟, 尚钰

计算机与现代化 2025, 0 (01): 1-6. DOI: 10.3969/j.issn.1006-2475.2025.01.001

摘要（242）

PDF（pc）（2429KB）（191）

立场检测是自然语言处理中的一个关键任务，它基于文本分析来判断作者的立场。文本立场检测方法从早期的机器学习方法过渡到BERT模型，然后发展到最新的大语言模型，如ChatGPT。由于受限于ChatGPT的闭源特性，本文利用国内开源的ChatGLM3模型，提出一种文本立场检测模型ChatGLM3-LoRA-Stance。为了将大模型有效地应用于专业垂直领域，采用LoRA这一高效的微调方法。与P-Tuning V2相比，LoRA更能适应本文中的零样本和少样本文本立场检测任务。使用公开的VAST数据集对ChatGLM3模型进行微调，评估现有模型在零样本和少样本场景中的性能。实验结果显示，ChatGLM3-LoRA-Stance模型在零样本和少样本检测任务上，F1得分均显著高于其他模型。因此，研究结果凸显了大语言模型在文本立场检测任务上的潜力，并表明使用LoRA高效微调技术能够显著提升ChatGLM3大语言模型在文本立场检测任务中的性能。

参考文献 | 相关文章 | 多维度评价 | 评论（0）

Select

40. 基于多尺度ResNet融合注意力机制的麦冬细粒度识别

秦竹媛, 吴浩忠, 谭代庆, 韩爱庆, 臧昊, 王选, 唐燕

计算机与现代化 2023, 0 (07): 105-111. DOI: 10.3969/j.issn.1006-2475.2023.07.018

摘要（240）

PDF（pc）（4687KB）（121）

中药材鉴别依赖于中药师的经验，效率低且没有统一的量化标准。针对川麦冬、山麦冬和浙麦冬3类易混淆中药饮片图像细粒度分类问题，本文提出一种基于ResNet-152残差神经网络的改进模型MARNet-152（Multiscale-Attention Residual Network-152），辅助人工自动辨识3种易混淆的麦冬饮片。基于ResNet-152残差神经网络构建改进的模型MARNet-152，对ResNet-152网络结构中Bottleneck的3×3卷积核进行分组卷积以提取和表示多尺度特征；引入结合空间和通道的卷积注意力机制模块（Convolutional Block Attention Module， CBAM），使模型更关注识别目标物体细节并具有更好的解释性。改进后的网络模型在麦冬图像细粒度识别时达到91.42%的分类精度，相较于基础模型提高了6.62个百分点，可为麦冬识别提供参考。MARNet-152模型具有更高的泛化能力，识别效果较原始ResNet-152模型提升非常明显。

相关文章 | 多维度评价 | 评论（0）

摘要点击排行