全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 两年内
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 基于3D-SIFT与4PCS融合的大数据量点云快速配准方法
    李家乐1, 李哲润1, 赵 勇2, 张 杨1
    计算机与现代化    2024, 0 (02): 1-6.   DOI: 10.3969/j.issn.1006-2475.2024.02.001
    摘要290)      PDF(pc) (1952KB)(535)    收藏
    摘要:测量点云与模型点云的配准是视觉定位的关键。针对测量点云数据量大且与CAD模型点云重叠率低造成视觉定位精度差、算法效率低的问题,提出一种基于三维尺度不变特征变换(3D-SIFT)与4点快速鲁棒匹配算法(4PCS)融合的测量点云与模型点云配准方法。首先利用深度相机对零件进行点云提取并对提取到的测量点云进行降噪和滤波处理;接着利用3D-SIFT特征点提取算法对测量点云和CAD模型点云进行特征点提取;最后把提取的特征点作为4PCS算法的初始值进行2种点云数据的配准。与常用的4PCS算法、Super-4PCS算法相比,在算法仿真与实际应用实验结果表明,本文算法在保证配准精度的前提下将配准速度提高30%以上。



    参考文献 | 相关文章 | 多维度评价 | 评论0
    2. 基于雾计算的制造物联网数据处理技术综述
    韩 坤, 王 政, 段俊勇, 杨化林
    计算机与现代化    2024, 0 (01): 13-20.   DOI: 10.3969/j.issn.1006-2475.2024.01.003
    摘要106)      PDF(pc) (1208KB)(414)    收藏
    摘要:制造物联网(MIoT)是一种将制造业生产系统与互联网连接相结合的技术,数据处理更是在制造物联网中发挥着至关重要的作用。随着制造业规模的不断扩大,传统的云计算已经逐渐不能满足数据处理的需求,雾计算的发展则能有效地减少决策延迟,提高系统效率。本文概述基于雾计算的制造物联网数据处理技术,首先介绍MIoT数据的产生、特点,以及数据处理过程中所要面对的挑战。其次,介绍基于雾计算的MIoT数据处理架构。然后,介绍雾计算数据处理的关键技术。最后,介绍该架构在部署时需要面对的挑战,以及雾计算在MIoT中应用的未来发展方向。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    3. 基于BERT的电子病历命名实体识别
    郑立瑞, 肖晓霞, 邹北骥, 刘 彬, 周 展
    计算机与现代化    2024, 0 (01): 87-91.   DOI: 10.3969/j.issn.1006-2475.2024.01.014
    摘要234)      PDF(pc) (992KB)(389)    收藏
    摘要:电子病历是保存、管理、传输病人医疗记录的重要资源,是医生诊治疾病的重要文本记录。通过电子病历命名实体识别(NER)技术能够高效、智能地从电子病历中抽取症状、疾病、药名等诊疗信息,有利于结构化电子病历,使之能够使用机器学习等技术进行诊疗规律挖掘。为了高效识别电子病历中的命名实体,提出一种融合对抗训练(FGM)的基于BERT与双向长短期记忆网络(BILSTM)的命名实体识别方法(BERT-BILSTM-CRF-FGM, BBCF),对2017全国知识图谱与语义计算大会(CCKS2017)提供的中文电子病历语料做修正等预处理后,采用BBCF模型识别该语料中5种实体的平均F1值为92.84%,比基于膨胀卷积网络的BERT模型(BERT-IDCNN-CRF)和基于BILSTM的条件随机场模型(BILSTM-CRF)有更高的F1值和更快的收敛速度,能够更加高效地结构化电子病历文本。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    4. 面向摄像头视频监控的泥石流发生场景智能识别方法
    胡美辰1, 2, 刘敦龙1, 2, 桑学佳1, 2, 张少杰3, 陈 乔4
    计算机与现代化    2024, 0 (03): 41-46.   DOI: 10.3969/j.issn.1006-2475.2024.03.007
    摘要184)      PDF(pc) (2573KB)(386)    收藏
    摘要:摄像头视频监控在泥石流防灾减灾中的应用较为广泛,但现有的视频检测技术功能有限,无法自动判断出泥石流灾害事件的发生。针对这一问题,本文基于迁移学习策略,改进一种基于卷积神经网络的视频分类方法。首先,借助TSN模型框架,将底层网络架构更改为ResNet-50,用于运动特征提取和泥石流场景识别。然后,通过ImageNet和Kinetics-400数据集预训练该模型,使模型具备较强的泛化能力。最后,结合经过预处理的地质灾害视频数据集对模型进行训练和微调,使其能够精准地识别出泥石流事件。通过大量的运动场景视频对该模型进行检验,实验结果表明,该方法对泥石流运动场景视频的识别准确率可达87.73%。因此,本文的研究成果可充分发挥视频监控在泥石流监测预警中的作用。

    参考文献 | 相关文章 | 多维度评价 | 评论0
    5. 基于改进U-Net的髋关节关键点检测算法
    陈 震1, 姚京辉2, 苏成悦1
    计算机与现代化    2024, 0 (02): 15-19.   DOI: 10.3969/j.issn.1006-2475.2024.02.003
    摘要172)      PDF(pc) (1367KB)(374)    收藏
    摘要:使用骨盆X光片诊断发育性髋关节发育不良(Developmental Dysplasia of the Hip, DDH)要求准确地标注髋关节关键点,而深度学习方法能作为可靠的辅助工具。针对骨盆片拍摄姿势和拍摄距离多样化问题,本文基于U-Net提出了RKD-UNet来检测髋关节关键点。该模型使用残差块改进U-Net的卷积层和skip-connection路径,并将坐标注意力引入到编码器中以增强模型对关键点邻域的特征提取能力。在编码器顶部使用卷积和ASPP模块构成Bridge块,以[3, 6, 9]的空洞率融合不同尺度的特征信息并提升模型的感受野。本文使用包含骨盆正位片、蛙位片、下肢全长片和术后骨盆片的数据集训练和测试模型。RKD-UNet实现了3.19±2.19 px的平均关键点检测误差和2.83°±2.59°的平均髋臼角测量误差。对正常、轻度、中度和重度脱位案例诊断的F1分数分别达到89.6、77.1、57.9和94.1,高于医生的手动诊断结果。实验结果表明,RKD-UNet能准确检测髋关节关键点并辅助医生诊断DDH。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    6. 基于多模态特征融合的抑郁症识别
    谷明轩, 范冰冰
    计算机与现代化    2023, 0 (10): 17-22.   DOI: 10.3969/j.issn.1006-2475.2023.10.003
    摘要614)      PDF(pc) (1213KB)(328)    收藏
    抑郁症是一种常见的精神疾病,现有的抑郁症诊断主要依赖于抑郁量表和精神科医生的访谈,具有较强的主观性。近年来,越来越多的研究者致力于通过脑电特征或音频特征识别抑郁症患者,但并未有研究将脑电信息与音频信息有效地结合起来,忽略了音频和脑电数据之间的相关性。因此本文提出一种基于全连接神经网络的多模态特征融合模型,通过对音频模态和脑电模态信息的特征融合提升抑郁症识别的准确率,为抑郁症的识别提供新的角度和方法。实验表明,多模态特征融合在MODMA数据集上的抑郁症识别准确率达到了81.58%且高于单模态抑郁症识别方法的准确率。这表明,相比于单模态识别,多模态特征融合模型能够提高抑郁症识别的准确率。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    7. 基于SRv6技术的云网安全服务链自动编排方法
    王宏杰, 徐胜超, 杨 波, 毛明扬, 蒋金陵
    计算机与现代化    2024, 0 (01): 1-5.   DOI: 10.3969/j.issn.1006-2475.2024.01.001
    摘要160)      PDF(pc) (1156KB)(325)    收藏

    摘要:为提高云网数据中心的资源利用率、节约通信开销,基于SRv6(Segment Route IPv6)技术设计一种云网安全服务链自动编排方法。本文方法辅助并引导网络数据包沿着指定路径通过云网,确定报文的具体转发路径,减少对服务节点的依赖;建立最小化总带宽的目标函数,结合多种约束条件,满足自动编排的安全性;定义本地行为报文,架构安全服务链自动编排框架,建立安全服务策略,解决策略冲突和网络流调度问题,达到服务链的安全编排。实验结果表明,本文方法能有效地实现云网服务链自动编排,减少CPU平均总带宽消耗,提升用户的请求成功率,降低云网中边缘设备的负载,节省通信开销。

    参考文献 | 相关文章 | 多维度评价 | 评论0
    8. 基于优化八叉树的场景视锥体裁剪算法
    李颖颖, 黄文培
    计算机与现代化    2024, 0 (01): 103-108.   DOI: 10.3969/j.issn.1006-2475.2024.01.017
    摘要140)      PDF(pc) (1038KB)(321)    收藏
    摘要:大体量3D模型容易导致浏览器端渲染帧数低、显示卡顿及资源消耗大等问题,其原因是这类模型通常包含数以亿计的三角面片,在有限的时间内无法实现快速加载与渲染。针对此类问题,提出一种基于优化八叉树的场景视锥体裁剪算法。该算法采用地址码(Morton码)、节点视距标准和按需增量划分技术,使得八叉树具有自适应性与良好的压缩效率;采用双层包围体和基础相交测试技术,提高视锥体裁剪的精确性,整体上实现提升渲染帧数、显示流畅的目标。高速列车实例模型研究表明,与传统八叉树视锥体裁剪算法相比,所提算法平均渲染帧数上提高了约 14帧,空间压缩率提高了37.8个百分点。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    9. 毫米波大规模MIMO-NOMA系统用户分簇和功率分配设计
    李旺旺, 黄学军
    计算机与现代化    2024, 0 (02): 29-35.   DOI: 10.3969/j.issn.1006-2475.2024.02.005
    摘要92)      PDF(pc) (2532KB)(312)    收藏
    摘要:针对多用户毫米波大规模多输入多输出-非正交多址接入(MIMO-NOMA)系统功率分配计算复杂的问题,提出新用户分簇和功率分配方案,提高系统的频谱效率。首先改进基于簇头选择的用户分簇方案,根据真实信道动态选择阈值并确定分簇数目,使分簇结果更适合实际情况,用户从波束中获得更大增益。然后以最大化系统频谱效率和能量效率的加权和为目标设计功率分配,使用改进的元启发算法求解。通过对粒子群(PSO)算法引入新的矢量成分和添加余弦扰动使算法更快收敛到全局最优值,并融合沙猫优化(SCSO)算法使算法结果更加精确。仿真结果表明,与现有算法相比,本文提出方案的频谱效率和能量效率优于传统方案,且更适合多用户情况。




    参考文献 | 相关文章 | 多维度评价 | 评论0
    10. 红外小目标检测方法综述
    胡睿杰, 车 逗
    计算机与现代化    2023, 0 (08): 79-86.   DOI: 10.3969/j.issn.1006-2475.2023.08.013
    摘要501)      PDF(pc) (5630KB)(312)    收藏
    摘要:本文旨在对基于传统的特征提取、局部对比与现今使用广泛的深度学习的3种红外小目标检测方法进行综述,并通过对比这3种方法的前沿应用,分析其在目标检测性能、鲁棒性和实时性等方面的优势和不足。从中发现,基于特征提取的方法在简单场景下具有较好的实时性和鲁棒性,但在复杂场景下可能受限。基于局部对比方法对目标的尺寸和形状变化相对鲁棒,但对背景干扰较为敏感。基于深度学习的方法在目标检测性能方面表现出色,但需要大量数据和较大的计算资源。因此,在实际应用中,应根据具体场景需求综合考虑这些方法的优缺点,并选择合适的方法进行红外小目标检测。
    相关文章 | 多维度评价 | 评论0
    11. 基于生成对抗网络的乳腺癌免疫组化图像生成
    卢梓菡1, 张 东1, 杨 艳1, 杨 双2
    计算机与现代化    2024, 0 (03): 92-96.   DOI: 10.3969/j.issn.1006-2475.2024.03.015
    摘要123)      PDF(pc) (2044KB)(283)    收藏

    摘要:乳腺癌是一种凶险的恶性肿瘤,医学上需要根据人表皮生长因子受体2(HER2)水平来判断乳腺癌的侵袭性,从而制定治疗方案,这就需要对组织切片进行免疫组化(IHC)染色。为了解决IHC染色昂贵且费时的问题,首先,提出一种基于混合注意力残差模块的HER2预测网络,在残差模块中加入了CBAM模块,使得网络能够在空间、通道维度上更有侧重性地学习。预测网络能够由HE染色切片直接预测HER2水平,并且预测准确率达到97.5%以上,对比其他网络提升了2.5个百分点以上。随后提出一种多尺度生成对抗网络,使用引入混合注意力残差模块的ResNet-9blocks作为生成器,PatchGan作为判别器,并自定义多尺度损失函数。生成对抗网络可以由HE染色切片直接生成模拟IHC染色切片,在低HER2水平下生成的图像与真实图像的SSIM为0.498,PSNR为24.49 dB。

    参考文献 | 相关文章 | 多维度评价 | 评论0
    12. 一种针对抖动无人机视频的运动目标检测算法
    刘耀鑫1, 陈仁喜2, 杨伟宏1
    计算机与现代化    2024, 0 (05): 99-103.   DOI: 10.3969/j.issn.1006-2475.2024.05.017
    摘要130)      PDF(pc) (2681KB)(274)    收藏

    摘要:针对悬浮无人机在运动目标检测中易受抖动影响,导致大量背景噪声的问题,提出一种多尺度的EA-KDE背景差分算法(MEA-KDE)。该算法首先对图像序列进行多尺度分解,以获取多尺度的图像序列。然后,在进行检测之前,通过考虑面积阈值和当前图像帧,计算并更新检测的分割阈值,引入当前图像帧信息。其次,对不同尺度的图像帧采用高低双分割阈值进行背景差分运算,以提高检测的鲁棒性。最后,通过对各尺度的检测结果采用一种自顶向下的融合策略进行融合,以在保留目标的清晰轮廓同时消除噪声。此外,提出的一种边界扩展融合后处理算法有助于减轻检测断裂引起的目标破碎现象。实验结果表明,所提算法能够有效抑制抖动导致的背景噪声。在2个真实拍摄的无人机数据集上,分别获得了0.951和0.952的平均F1分数,相较于原算法分别提高了0.144和0.276。


    参考文献 | 相关文章 | 多维度评价 | 评论0
    13. 基于数字孪生的铝电解槽三维可视化监控系统
    张高义1, 徐 杨1, 2, 曹 斌1, 3, 李毅飞3
    计算机与现代化    2024, 0 (05): 104-109.   DOI: 10.3969/j.issn.1006-2475.2024.05.018
    摘要89)      PDF(pc) (3159KB)(269)    收藏

    摘要:传统的铝电解槽管理存在着管理方式单一、透明度低和参数数据呈现形式弱等问题。为了解决这些问题,本文引入数字孪生技术,将其应用到铝电解槽中,基于数字孪生理论模型及框架进行改进,提出数字孪生铝电解槽的三维可视化监控系统六维模型。基于此模型构建电解槽虚拟模型、场景优化、数据采集及数据映射,通过Java后台提供数据接口,使用three.js三维技术结合JavaScript语言对模型以及数据进行渲染,最终设计实现铝电解槽的三维可视化监控系统。该系统为现场人员提供更加直观的展示效果,使其能更好地了解铝电解槽运行状况,为铝行业智能化发展提供有效思路。



    参考文献 | 相关文章 | 多维度评价 | 评论0
    14. 基于改进AlexNet网络的泥石流次声信号识别方法
    袁 莉1, 2, 刘敦龙1, 2, 桑学佳1, 2, 张少杰3, 陈 乔4
    计算机与现代化    2024, 0 (03): 1-6.   DOI: 10.3969/j.issn.1006-2475.2024.03.001
    摘要139)      PDF(pc) (3108KB)(269)    收藏
    摘要:环境干扰噪声是泥石流次声现场监测的主要挑战,极大限制了泥石流次声信号识别的准确率。鉴于深度学习在声学信号识别中的优异表现,本文提出一种基于改进的AlexNet网络的泥石流次声信号识别方法,有效提升泥石流次声信号识别准确率和收敛速度。首先对原始次声数据集进行数据扩充、滤波降噪等预处理,并利用小波变换生成时频谱图像,然后将得到的时频谱图像作为输入,通过减小卷积核、引入批量归一化层和选择Adam优化算法搭建改进的AlexNet网络模型。实验结果表明,改进的AlexNet网络模型识别准确率为91.48%,实现了泥石流次声信号的智能识别,可为泥石流次声监测预警提供高效、可靠的技术支撑。
    相关文章 | 多维度评价 | 评论0
    15. 基于PWLCM和秃鹰俯冲机制改进的野狗优化算法
    欧基发, 蔡茂国, 洪广杰, 詹楷杰
    计算机与现代化    2024, 0 (01): 109-116.   DOI: 10.3969/j.issn.1006-2475.2024.01.018
    摘要104)      PDF(pc) (1163KB)(259)    收藏
    摘要:针对野狗优化算法(Dingo Optimization Algorithm, DOA)收敛速度偏慢和寻优精度较低等问题,提出一种基于PWLCM和秃鹰机制改进的野狗优化算法(Improved Dingo Optimization Algorithm, IDOA)。首先,使用具有遍历性的分段线性混沌映射(Piecewise Linear Chaotic Map, PWLCM)初始化野狗种群,有效增加野狗种群多样性。其次,在迫害策略中引入秃鹰俯冲机制,加快野狗捕获猎物的速度,加强算法探索局部的能力。最后,在食腐策略引入螺旋搜索因子,增强算法的局部寻优能力,提升算法的寻优速度和求解精度。仿真实验数据、消融实验以及Wilcoxon秩和检验均表明,与其他对比算法相比,提出的IDOA在所有测试函数上有着更佳的寻优速度以及寻优精度;与其他改进的野狗优化算法相比,所提出的IDOA展现出更好的整体性能。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    16. 基于无监督域适应的室外点云语义分割
    胡崇佳, 刘金洲, 方 立
    计算机与现代化    2024, 0 (01): 74-79.   DOI: 10.3969/j.issn.1006-2475.2024.01.012
    摘要182)      PDF(pc) (2419KB)(259)    收藏
    摘要:为处理室外大规模场景中语义分割网络训练需求数据量过大的问题,提出一种基于无监督域自适应的点云语义分割方法。该方法使用改进的RandLA-Net以SPTLS3D真实世界数据集的少量点云作为目标对象进行语义分割。模型在SensatUrban数据集上完成分割网络的预训练,通过缩小源域和目标域之间的域差距来完成模型的迁移。RandLA-Net编码过程会缺失原始点云全局特征,因此本文提出一种额外获取全局信息加入网络解码的方法。此外,为增强差异化信息的获取,RandLA-Net的局部注意力模块权值改为根据各点的特征和其邻域的平均特征的差值。实验显示,该网络在SemanticKITTI数据集上的平均交并比精度达到54.3%,在Semantic3D上的平均交并比精度达到了71.91%。预训练好的模型经过微调后平均交并比精度达到了80.05%,比直接训练的效果好8.83个百分点。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    17. 基于改进D3QN算法的泊车机器人路径规划
    王健铭1, 王 欣1, 李养辉2, 王殿龙1
    计算机与现代化    2024, 0 (03): 7-14.   DOI: 10.3969/j.issn.1006-2475.2024.03.002
    摘要164)      PDF(pc) (2440KB)(251)    收藏
    摘要:针对城市泊车问题,泊车机器人应运而生,其路径规划是重要的研究方向。由于A*算法的局限性,本文引入深度强化学习思想,并对由此发展起来的D3QN算法进行改进,将残差网络取代卷积网络,引入注意力机制,从而提出SE-RD3QN算法,以改善网络退化现象和提高收敛速度,并提升模型的精准率。在算法训练过程中,改进奖惩机制,以实现最优方案的快速收敛。通过与D3QN算法、增加残差层的RD3QN算法的对比实验,结果表明本文提出的SE-RD3QN算法在模型训练时可实现更快的收敛速度。与目前常用的A*+TEB算法的对比实验,结果表明本文算法在路径规划时可获得更短的路径长度与规划时间。最后通过模拟小车的实物实验,进一步验证了算法的有效性。这为停车路径规划提供了新的解决方案。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    18. 基于改进YOLOv5的复杂路况密集行人检测方法
    孙睿琦1, 窦修超2, 李志华1, 蒋雪梅2, 孙宇豪1
    计算机与现代化    2024, 0 (05): 85-91.   DOI: 10.3969/j.issn.1006-2475.2024.05.015
    摘要110)      PDF(pc) (2884KB)(238)    收藏

    摘要:针对复杂街景环境下行人检测精度低的问题,基于YOLOv5网络,提出一种改进的行人检测网络YOLO-BEN。该网络将残差分级,利用连接模块Res2Net与C3模块进行融合,加强细粒度级别的多尺度特征表示。采用双层路由注意力模块,构建和修剪区域级有向图,在路由区域的联合中应用细粒度的注意力,使网络具备动态的查询感知稀疏性,提高对模糊图像的特征提取能力。改进原网络Neck部分进一步保留局部角区域信息,弥补被遮挡行人的信息丢失问题。使用NWD度量与原有的IoU度量形成联合损失函数,同时增加小目标检测头,提高远距离行人检测效果。实验中该方法在自制数据集和部分WiderPerson数据集上取得了较好的效果,改进后比原始网络的精确率、召回率、平均精度分别提高了2.8、4.3、3.9个百分点。




    参考文献 | 相关文章 | 多维度评价 | 评论0
    19. 基于多视图的知识感知推荐系统#br#
    王晓霞, 孟佳娜, 江 烽, 丁梓晴
    计算机与现代化    2024, 0 (02): 100-107.   DOI: 10.3969/j.issn.1006-2475.2024.02.016
    摘要117)      PDF(pc) (2064KB)(237)    收藏
    摘要:现在基于知识图谱的推荐方法中,大多采用单一用户或项目表示,存在用户兴趣干扰、信息不完全利用和数据稀疏的问题。本文提出一种基于多视图的知识感知推荐模型(Multi-view Knowledge-aware, MVKA)。首先,该模型在用户-项目图融合注意力机制捕获用户的兴趣表示;引入项目-实体图,设计图注意力网络进行特征提取获取项目的嵌入表示;然后在2个视图之间构造图视角的对比学习方法,最后进行求和和串联操作得到用户和项目的最终表示,并通过内积预测用户对项目的匹配分数。为了验证本文模型的准确性和计算效率,在MovieLens-1M、Book-crossing和Last FM公开数据集上进行了大量的实验,并且与其他传统方法和图神经网络模型相比,AUC和F1值评价指标均有明显提升,说明 MVKA模型可显著利用各种信息关系数据来改善知识感知推荐任务。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    20. 基于深度学习的人体行为检测方法研究综述
    沈加炜, 陆一鸣, 陈晓艺, 钱美玲, 陆卫忠,
    计算机与现代化    2023, 0 (09): 1-9.   DOI: 10.3969/j.issn.1006-2475.2023.09.001
    摘要681)      PDF(pc) (2112KB)(228)    收藏
    当下结合计算机视觉和视频的特征提取对人体行为动作进行捕捉识别的研究炙手可热,并且其在智能视频监控和智能家居的人机交互等其他领域方向上的应用场景也十分丰富。基于传统方法的人体行为检测算法有着依赖数据样本过多、易受环境噪音影响从而降低精确率等缺点,而不断发展的深度学习技术逐渐展现出它的优势,可以很好地解决这些问题。本文基于此,首先介绍一些目前常用的行为识别数据集并在此基础上剖析当下基于深度学习的人体行为识别检测的研究现状;其次描述常见的人体行为识别检测方法及其识别的流程;最后对现存的各种行为识别检测方法性能、现存问题进行总结和未来发展方向进行展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    21. 老年人跌倒检测技术研究综述
    王梦溪, 李峻
    计算机与现代化    2024, 0 (08): 30-36.   DOI: 10.3969/j.issn.1006-2475.2024.08.006
    摘要378)      PDF(pc) (2530KB)(227)    收藏
    随着我国老龄化程度加剧,空巢独居老人所占比重明显上升,适老化设备越来越受到人们的关注。家庭环境下,由于无人看护、年龄增加以及突发疾病等一系列客观或主观原因导致的老年人跌倒已经成为威胁老年人健康的主要原因之一。因此,实时监测老年人的居家行为,对摔倒行为及时做出检测和预警,在一定程度上可以保障老人的生命安全,降低老年人由于意外跌倒所带来的生命健康风险。本文在对近几年跌倒检测方法研究进行广泛调研的基础上,根据数据获取所使用的不同类型传感器,将跌倒检测技术主要分成2类:非视觉跌倒检测方法和视觉跌倒检测方法。总结介绍了不同跌倒检测方式的系统构成,探讨了国内外最新的相关研究成果,并对其方法特点和实际应用进行了讨论。随着近几年深度学习技术的快速蓬勃发展,本文对基于深度学习的跌倒检测方法进行了重点调研,对相关算法原理及研究成果进行了深入分析与总结。此外,本文还介绍了常用的公开跌倒检测数据集,包括它们的规模和存储格式等特性,最后本文对跌倒检测技术近年来已取得的进展和未来的发展趋势分别进行总结和展望,并提出了不同方面的合理发展建议。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    22. 基于双向多步预测的炉管温度场重构方法
    林启钊, 彭志平, 郭 棉, 崔得龙
    计算机与现代化    2024, 0 (01): 53-58.   DOI: 10.3969/j.issn.1006-2475.2024.01.009
    摘要119)      PDF(pc) (1682KB)(218)    收藏
    摘要:针对高温封闭的乙烯裂解环境下裂解炉炉管温度感知难的问题,提出一种融合机理和长短记忆神经网络(Long Short-Term Memory, LSTM)的裂解炉炉管表面温度场重构方法。该方法首先基于计算流体力学仿真平台fluent构建乙烯裂解反应机理模型,用来描述裂解反应与炉管温度的数学关系,然后利用工业现场数据对机理模型进行数值矫正和过程参数求解,进一步基于皮尔逊相关系数确定适用性强的主要过程参数,在此基础上,设计卷积块注意力模块(Convolutional Block Attention Module, CBAM)对反映裂解反应与炉管温度关系的主要过程参数的特征进行提取,最后基于遗传算法和LSTM网络设计双向多步预测模型(GA-BMLSTM)对炉管温度分布进行预测。实验结果表明该方法对炉管温度场的重构有较高的准确率和较强的适用性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    23. 基于无模型自适应控制的视觉伺服
    彭宗玉, 黄开启, 苏建华, 王丽丽
    计算机与现代化    2024, 0 (01): 29-34.   DOI: 10.3969/j.issn.1006-2475.2024.01.005
    摘要138)      PDF(pc) (1958KB)(214)    收藏
    摘要:传统的机器人视觉伺服控制技术需要已知机器人精确的动力学和运动学模型以及机器人的手-眼参数。然而,由于机器人建模、手-眼标定等过程存在一定误差,因此很难精确获得视觉伺服控制模型,从而影响机器人视觉伺服系统的精度和收敛速度。针对这一难题,本文提出一种基于无模型自适应控制方法(MFAC)的机器人视觉伺服技术。利用视觉伺服系统的输入与输出数据,实现自适应视觉伺服控制,即通过MFAC在线估计机器人伺服控制器中的雅各比矩阵,并结合滑模控制器,实现机器人对目标的快速精确跟踪。实验结果表明,本文提出的方法在系统参数变化引起的未知扰动情况下仍能保证伺服控制器平稳收敛,并且能够减小视觉跟踪误差。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    24. 一种面向城市战场的智能车自主导航方法
    李 鹏, 徐 珞
    计算机与现代化    2024, 0 (01): 92-98.   DOI: 10.3969/j.issn.1006-2475.2024.01.015
    摘要111)      PDF(pc) (2793KB)(210)    收藏
    摘要:城市战场是常规战争和日常治安的主要阵地,出色的城市战场突防能力能够帮助我方作战人员更好、更快地完成侦查、打击、营救等任务。然而,城市内街道环境错综复杂同时还可能存在敌方的拦截,使得城市战场环境复杂多变,大大增加了完成任务的难度。传统的路径规划方法依赖于精确的静态地图和规则约束,缺乏灵活性和适应性。因此,本文提出一种面向城市战场的智能车自主导航方法,并设计离散的动作空间和基于任务完成度的奖励函数。首先,以城市战场突防任务为例,设计状态空间、动作空间,并选择适合的深度强化学习算法;然后,基于Gazebo仿真平台和ROS设计算法流程框架和实验方案。实验结果表明,在城市战场环境下运用该方法的智能小车能够有效地穿越障碍并躲避敌方单位到达指定地点,提高了突防的成功率。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    25. 改进生成对抗网络的图像去雾算法
    刘彦红, 杨秋翔
    计算机与现代化    2024, 0 (02): 56-63.   DOI: 10.3969/j.issn.1006-2475.2024.02.009
    摘要159)      PDF(pc) (4948KB)(202)    收藏
    摘要:雾霾天气下,可见光透过大气层时发生散射和吸收,导致图像质量变差、信息遮挡或丢失。基于此提出改进生成对抗网络(GAN)的图像去雾算法,该算法在生成器和鉴别器对抗中学习生成去雾图像。在生成器中,提出一种3行多列的多尺度融合注意力网络(Grid-G),引入通道注意力和像素注意力,分别从不同角度处理图像的厚雾区域和高频区域。在鉴别器中,引入图像中的高低频信息构建融合鉴别器(FD-F),将其作为额外先验判别图像的来源。在RESIDE数据集对合成数据和真实数据进行实验,实验结果表明本文算法在峰值信噪比和结构相似度等方面均优于其余对比算法,取得了更好的去雾效果,有效改善颜色失真等问题。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    26. 手势识别与交互综述
    魏嘉焜, 王家润
    计算机与现代化    2024, 0 (08): 67-76.   DOI: 10.3969/j.issn.1006-2475.2024.08.012
    摘要292)      PDF(pc) (1322KB)(201)    收藏
    手势识别与交互技术是人机交互技术与人工智能技术前沿研究的基石任务。该任务以计算机和设备协同工作识别、处理手势信息并给出与手势相对应的机器操作为主要目标,融合应用了动作捕捉、图像处理、图像分类、多端协同交互工作等多项技术,是支撑指挥控制系统、机器人交互、医疗操作等当下前沿智能交互工作与人机交互工作的有力保障。目前,手势识别与交互的相关研究已经日渐成熟,应用领域广泛、应用场景丰富。本文主要对手势识别与交互的相关技术和硬件发展做出综述。首先,全面梳理手势识别与交互技术的研究进展,同时对手势识别的关键步骤进行归类描述;其次,分类阐述用于三维手势交互的当前主流手势识别深度传感器的相关工作;随后,对三维手势识别的真实感识别技术进行剖析和讨论;最后,分析手势识别与交互技术中存在的不足与亟待改进的问题,提出融合深度学习、模式识别等前沿技术与有可行性的研究思路和方法,对该领域未来的研究方向、技术发展和应用领域做出预测和展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    27. 个性化新闻推荐系统研究综述及探讨
    翟 梅
    计算机与现代化    2024, 0 (04): 12-20.   DOI: 10.3969/j.issn.1006-2475.2024.04.003
    摘要259)      PDF(pc) (1534KB)(195)    收藏

    摘要:随着新闻媒体技术的快速发展,网络新闻数量呈指数级增长。为了解决网络信息过载的问题,个性化新闻推荐扮演着极其关键的角色。它通过学习用户的浏览行为、兴趣爱好等信息,主动为用户提供感兴趣的新闻,从而提高用户的阅读体验。个性化新闻推荐逐渐成为新闻领域及计算机科学领域的研究热点和实践难题,业界专家已提出多种推荐算法用于提高推荐系统的性能。本文系统阐述个性化新闻推荐的国内外最新研究现状和进展,首先,简要介绍新闻推荐系统的架构,并对新闻推荐系统中核心推荐算法和常用评价指标进行研究。虽然个性化新闻推荐给用户带来很好的体验,但是潜移默化中也给用户带来很多未知的影响。跟其他新闻推荐综述不同的是,本文还结合新闻媒体专业研究了当前新闻推荐系统对用户行为产生的影响及面临的问题。最后,根据当前遇到的问题提出个性化新闻推荐的研究方向及未来工作重点。


    参考文献 | 相关文章 | 多维度评价 | 评论0
    28. 基于扩张卷积融合时序特征异常行为检测
    马彩莎, 焦立男, 柳有权, 李 欣
    计算机与现代化    2024, 0 (02): 75-80.   DOI: 10.3969/j.issn.1006-2475.2024.02.012
    摘要57)      PDF(pc) (2029KB)(194)    收藏
    摘要:本文提出一个基于扩张卷积的多尺度融合行人原型和时空特征的深度自编码器网络。为了更好地利用视频中行人的时序特征,在编码器和解码器的潜在空间处添加一个双分支结构,分别是预测时空特征的递归神经网络分支和保存行人正常模式的记忆存储模块。为了增强行人特征提取,忽略背景信息影响,增加模型的泛化能力,在编码器中加入改进的空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,并在卷积块中使用混合扩张卷积(Hybrid Dilated Convolution,HDC)原则,解决行人大小变化的问题,同时在解码器中引入多级残差信道注意力机制,获取更多的上下文信息。模型在数据集USCD Ped2,CUHK Avenue的曲线下面积(Area Under the Curve,AUC)分别达到了0.982,0.928。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    29. 基于图神经网络的多层银企网络融合研究
    李 珊, 王林娜, 高丁佳, 宣海波
    计算机与现代化    2024, 0 (05): 27-32.   DOI: 10.3969/j.issn.1006-2475.2024.05.006
    摘要98)      PDF(pc) (1346KB)(190)    收藏
    摘要:针对金融行业内潜在系统性风险难以精准识别问题,基于直接系统性风险传染渠道的借贷数据以及间接渠道的互联网文本信息,构建多层银企网络,并利用图卷积神经网络(GCN)设计多层银企网络融合模型,根据融合网络量化评估29家银行和75家房地产机构的不同渠道系统性风险传染过程。实验结果表明,在多层金融网络融合任务上,本文融合模型的准确率达到0.8559,优于对比模型。融合网络分析表明,多层网络共同冲击下的银企系统性风险传染能力明显大于单一或者2层网络的系统性风险,且基于间接渠道的企业间网络系统性风险更明显。金融审慎监管应该更多关注文本数据、深度学习等技术对于整合庞大金融资源的能力和有效提高风险监测预警的能力。






    参考文献 | 相关文章 | 多维度评价 | 评论0
    30. Regformer:基于稀疏注意力的输油管道水力压降预测方法
    李亚平, 王军防, 余红梅, 窦一民, 肖 媛, 田继林
    计算机与现代化    2024, 0 (01): 59-66.   DOI: 10.3969/j.issn.1006-2475.2024.01.010
    摘要101)      PDF(pc) (5692KB)(186)    收藏
    摘要:输油管道水力压降预测对于输油管道的生产调控十分重要,目前机器学习方法将压降预测看作回归问题,然而管道水力计算受多种因素影响,传统的机器学习方法由训练集得到的固定权重难以泛化到更多的测试样例或真实的工程场景中。本文提出一种水力压降回归预测方法Regformer,该方法将稀疏注意力机制引入回归任务,在多头注意力的基础上设计一种平滑概率方法,并融入特征投影机制。在10个公共数据集上对7种主流方法进行对比实验分析,定性实验显示Regformer对于局部的突变有很好的拟合能力;水力压降预测实验表明自注意力方法对于多变量不确定性的回归任务具有显著的优势,尤其是对极端情况的处理体现了自适应回归参数的重要性,并且Regformer用了更少的计算量取得了比Transformer更好的性能,验证了本文提出的稀疏注意力和自适应特征投影在水力压降预测任务中的优越性。

    参考文献 | 相关文章 | 多维度评价 | 评论0
    31. 一种基于联合加权和截断的毫米波大规模MIMO信道估计
    张志能, 黄学军
    计算机与现代化    2024, 0 (04): 1-4.   DOI: 10.3969/j.issn.1006-2475.2024.04.001
    摘要153)      PDF(pc) (1413KB)(184)    收藏
    摘要:提出一种联合加权和截断核范数的毫米波大规模多输入多输出(MIMO)信道估计算法。针对毫米波大规模MIMO信道估计问题中训练和反馈开销大的问题,首先利用毫米波信道天线角度域稀疏的特性,把信道估计问题转化为低秩矩阵恢复问题。采用一种有效而灵活的秩函数——联合加权截断核范数作为核范数的松弛,构造出一种新的矩阵恢复模型用于信道估计问题,以最小化加权截断核范数为优化目标,并利用交替优化框架求解。仿真结果表明,该方法可以有效地提高信道估计的精度,并且具有可靠的收敛性。




    参考文献 | 相关文章 | 多维度评价 | 评论0
    32.    基于LoRA高效微调通用语言大模型的文本立场检测
    韩霄龙, 曾曦, 刘锟, 尚钰
    计算机与现代化    2025, 0 (01): 1-6.   DOI: 10.3969/j.issn.1006-2475.2025.01.001
    摘要232)      PDF(pc) (2429KB)(184)    收藏
    立场检测是自然语言处理中的一个关键任务,它基于文本分析来判断作者的立场。文本立场检测方法从早期的机器学习方法过渡到BERT模型,然后发展到最新的大语言模型,如ChatGPT。由于受限于ChatGPT的闭源特性,本文利用国内开源的ChatGLM3模型,提出一种文本立场检测模型ChatGLM3-LoRA-Stance。为了将大模型有效地应用于专业垂直领域,采用LoRA这一高效的微调方法。与P-Tuning V2相比,LoRA更能适应本文中的零样本和少样本文本立场检测任务。使用公开的VAST数据集对ChatGLM3模型进行微调,评估现有模型在零样本和少样本场景中的性能。实验结果显示,ChatGLM3-LoRA-Stance模型在零样本和少样本检测任务上,F1得分均显著高于其他模型。因此,研究结果凸显了大语言模型在文本立场检测任务上的潜力,并表明使用LoRA高效微调技术能够显著提升ChatGLM3大语言模型在文本立场检测任务中的性能。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    33. 融合词典信息和句子语义的中文命名实体识别
    王 谭, 陈金广, 马丽丽
    计算机与现代化    2024, 0 (03): 24-28.   DOI: 10.3969/j.issn.1006-2475.2024.03.004
    摘要97)      PDF(pc) (1147KB)(183)    收藏
    摘要:受益于深度学习技术的蓬勃发展,命名实体识别任务的性能也得到了进一步的提升。然而,基于深度学习网络的模型的优秀性能严重依赖于大量的标注样本的支持,在缺少标注样本的小数据集上难以充分挖掘深层次信息,导致识别效果不佳。基于以上问题,本文提出一种融合词典信息和句子语义的中文命名实体识别模型LS-NER。首先,将字符在词典中匹配到的潜在词作为先验词汇信息供模型学习,应对中文分词问题。然后,将用于计算文本相似度的带有语义信息的句子嵌入并应用到命名实体识别任务中,帮助模型从相似的句子中寻找相似实体。最后,设计基于注意力机制思想的特征融合方式,使模型能够充分学习句子嵌入带来的语义信息。实验结果表明,本文模型在小数据集Resume和Weibo上应用均达到了不错的性能,在未增加其他外部信息的前提下,句子语义能帮助模型学习到更深层次的特征,比未添加句子信息的模型的F1分数分别高出0.15个百分点和2.26个百分点。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    34. 基于语义和结构增强的时序知识图谱问答方法
    黄政霖, 董宝良
    计算机与现代化    2024, 0 (03): 15-23.   DOI: 10.3969/j.issn.1006-2475.2024.03.003
    摘要148)      PDF(pc) (1330KB)(178)    收藏
    摘要:知识图谱作为自然语言处理领域中的热门研究主题之一,一直受到学术界的广泛关注。在现实中,知识问答过程往往携带时间信息,因此,近年来,应用时序知识图谱来完成知识问答的技术广泛受到学者的青睐。传统的时序知识图谱问答技术主要通过对问题进行编码来完成推理过程,但其无法处理问题中包含的复杂的实体和时间关系。基于此,提出一种基于语义和结构增强的时序知识图谱问答方法,在推理过程中兼顾问题的语义信息和结构信息,提升对复杂问题正确回答的概率。首先,该方法解析出问题中的隐式时间表达,并基于时序知识图谱中的信息,用直接表达方式改写问题,再根据问题集合中的时间粒度,按照不同的时间粒度聚合时序知识图谱中的时间信息。其次,基于问题中的实体信息和时间信息,对问题语义信息进行表示和融合,以加强对于实体和时间语义的学习。再次,基于提取到的实体完成子图提取,并利用图卷积神经网络提取子图的结构信息。最后,将融合后的问题语义信息与结构信息进行拼接,并对候选答案进行评分,选取评分最高的实体作为答案。在MultiTQ数据集上进行对比测试,实验结果表明,提出的模型优于其他基准模型。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    35. 基于对比学习MocoV2的COVID-19图像分类#br#
    许跃雯1, 李 明1, 李 莉2
    计算机与现代化    2024, 0 (02): 81-87.   DOI: 10.3969/j.issn.1006-2475.2024.02.013
    摘要90)      PDF(pc) (3940KB)(178)    收藏
    摘要:肺炎是一种常见多发感染性疾病,老年人和免疫力较弱者容易感染,尽早发现有助于后期治疗。肺部病变的位置、密度和清晰度等因素会影响肺炎图像分类的准确性。随着深度学习的发展,卷积神经网络被广泛应用于医学图像分类任务中,然而网络的学习能力依赖训练样本的数量和标签。针对电子计算机断层扫描(Computed Tomography, CT)的肺炎图像分类研究,提出一种基于自监督对比学习的网络模型(MCLSE),可以从无标记的数据中学习特征,提高网络模型的准确率。本文模型(MCLSE)首先设计辅助任务,从无标记的图像中挖掘表征完成预训练,提高模型在向量空间中学习数据映射关系的能力。其次,使用卷积神经网络提取特征,为了有效捕获更高层次的特征信息选择SENet网络改进分类模型,建模特征通道的相关性。最后,用训练好的权重加载改进后的分类模型中,下游任务中使用标记数据再次训练网络。在公开数据集SARS-CoV-2 CT和CT Scans for COVID-19 Classification上进行实验,实验结果表明MCLSE对整体样本分类的准确率分别达到99.19%和99.75%,较主流模型有很大提升。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    36. 面向飞机故障文本的信息抽取
    乔 璐, 孙有朝, 吴红兰
    计算机与现代化    2024, 0 (03): 61-66.   DOI: 10.3969/j.issn.1006-2475.2024.03.010
    摘要112)      PDF(pc) (1248KB)(174)    收藏
    摘要:针对人工提取飞机故障信息工作量大、效率低、成本高等问题,提出一种基于领域词典、规则和BiGRU-CRF模型的信息抽取方法。结合飞机领域知识的特点,基于飞机故障文本信息构建领域词典库和模板规则,并对故障信息进行语义标注。采用BiGRU-CRF深度学习模型进行命名实体识别,BiGRU获取上下文的语义关系,CRF解码生成实体标签序列。实验结果表明,基于领域词典、规则和BiGRU-CRF模型的信息抽取方法准确率高达95.2%,验证了该方法的有效性。本文方法能够准确识别出飞机故障文本中的关键词如时间、机型、故障件名称、故障件制造单位等信息,同时,根据领域词典和规则对识别结果进行修正,有效提高了信息抽取的效率和准确性,解决了传统实体抽取模型长期依赖人工特征的问题。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    37. 基于生成对抗网络的维语场景文字修改网络
    付鸿林, 张太红, 杨雅婷, 艾孜麦提·艾瓦尼尔, 马 博
    计算机与现代化    2024, 0 (01): 41-46.   DOI: 10.3969/j.issn.1006-2475.2024.01.007
    摘要121)      PDF(pc) (2063KB)(173)    收藏
    摘要:通过对维语的场景文字检测与识别研究发现,人工采集标注自然场景文字图像是耗时耗力的,因此人工合成的数据是作为训练数据的主要来源。为获得更加真实的数据,本文提出一种基于生成对抗网络的维语场景文字修改网络,利用高效的Transformer模块构建网络,充分提取图像全局与局部特征来完成维语场景文字图像修改,并添加微调模块,对最终结果进行微调。采用WGAN思想策略训练模型,可有效应对模型崩溃以及梯度爆炸等问题。通过在英文-英文,英文-维文的文字修改实验来验证模型的泛化能力和鲁棒性,无论在客观评价指标(SSIM、PSNR)还是视觉上均取得不错效果,并在真实场景数据集SVT以及ICDAR 2013上进行了验证。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    38. 基于代价敏感卷积神经网络的加密流量分类#br# #br#
    钟海龙1, 2, 何月顺1, 何璘琳1, 陈 杰1, 田 鸣3, 郑瑞银4
    计算机与现代化    2024, 0 (05): 55-60.   DOI: 10.3969/j.issn.1006-2475.2024.05.010
    摘要85)      PDF(pc) (1046KB)(173)    收藏
    摘要:针对加密流量分类中由于不平衡数据导致的分类偏差和少数类识别率低的问题,提出一种基于代价敏感卷积神经网络的加密流量分类方法。鉴于传统卷积神经网络在处理不平衡数据时容易偏向多数类,该方法引入动态权重调整策略,使其在每次迭代中根据代价敏感层的反馈来重新评估并自适应调整每个样本的权重。当少数类样本被模型误分类时,其权重会增加,促使模型在后续训练中更加关注它们。随着训练的进行,这种动态权重调整策略持续驱使模型改进并提高对少数类样本的识别能力,从而有效地应对类别不平衡问题。为了避免过拟合,该方法还采纳早停策略,当验证集性能连续下滑时及时终止训练。实验结果表明,本文所提出的网络模型在处理类别不平衡的加密流量分类问题上具有显著的优势,准确率和F1值均达到0.97以上。本文研究为加密流量分类提供了一种更为有效且适应于类别不平衡问题的解决方案,为网络安全领域的研究与应用提供了有益的探索。




    参考文献 | 相关文章 | 多维度评价 | 评论0
    39. 基于CNN-Transformer混合结构的遥感影像变化检测模型
    许叶彤, 耿信哲, 赵伟强, 张 月, 宁海龙, 雷 涛
    计算机与现代化    2023, 0 (07): 79-85.   DOI: 10.3969/j.issn.1006-2475.2023.07.014
    摘要591)      PDF(pc) (2633KB)(173)    收藏
    卷积神经网络和Transformer模型的出现,使得遥感影像变化检测技术不断进步,但是目前这2种方法仍存在不足:一方面,卷积神经网络由于其卷积核局部感知的特点无法对遥感影像进行全局信息建模;另一方面,Transformer虽然可以捕获遥感影像的全局信息,但是对影像变化的细节信息不能很好地建模,且其计算复杂度随图像的分辨率呈二次方增长。为了解决上述问题,获得更稳健的变化检测结果,本文提出一种基于卷积神经网络和Transformer混合结构的变化检测模型(CNN-Transformer Change Detection Network, CTCD-Net)。首先,CTCD-Net串联使用卷积神经网络和基于Transformer编解码结构来有效地编码遥感影像的局部特征和全局特征,从而提升网络的特征学习能力。其次,提出跨通道的Transformer自注意力模块(CSA)和注意力前馈网络(A-FFN),有效地降低了Transformer的计算复杂度。在LEVIR-CD和CDD数据集上进行了充分的实验,实验结果表明,CTCD-Net的检测精确度显著优于目前其他主流方法。
    相关文章 | 多维度评价 | 评论0
    40. 基于注意力机制的U-Net眼底图像分割算法
    张子旭, 李嘉莹, 栾鹏鹏, 彭圆圆
    计算机与现代化    2024, 0 (05): 110-114.   DOI: 10.3969/j.issn.1006-2475.2024.05.019
    摘要82)      PDF(pc) (3307KB)(169)    收藏

    摘要:视网膜眼底血管的半径、宽度等是评估眼部疾病的重要指标,因此精确分割眼底图像具有十分重要的意义。为了有效辅助医生诊断眼部疾病,本文提出一种新的神经网络分割眼底血管图像,基本思想是通过改进传统的U-Net模型,借助一种注意力融合机制,使用Transformer构建通道注意力机制和空间注意力机制,将2个注意力机制获取的信息进行融合,减少信息的丢失。此外,视网膜眼底图像的数量比较少,神经网络的系数比较大,训练时容易发生过拟合,所以引入DropBlock层解决此难题。在公开数据集DRIVE上面进行验证,与多种最新的方法进行对比,本文提出的方法获得最高的ACC值0.967和最高的F1值0.787。实验结果表明,本文提出的方法能够有效地分割眼底图像。



    参考文献 | 相关文章 | 多维度评价 | 评论0