Please wait a minute...

当期目录

    2024年 第0卷 第02期    刊出日期:2024-02-19
    上一期   
    算法分析与设计
    基于3D-SIFT与4PCS融合的大数据量点云快速配准方法
    李家乐1, 李哲润1, 赵 勇2, 张 杨1
    2024, 0(02):  1-6.  doi:10.3969/j.issn.1006-2475.2024.02.001
    摘要 ( 70 )   PDF (1952KB) ( 87 )  
    参考文献 | 相关文章 | 计量指标
    摘要:测量点云与模型点云的配准是视觉定位的关键。针对测量点云数据量大且与CAD模型点云重叠率低造成视觉定位精度差、算法效率低的问题,提出一种基于三维尺度不变特征变换(3D-SIFT)与4点快速鲁棒匹配算法(4PCS)融合的测量点云与模型点云配准方法。首先利用深度相机对零件进行点云提取并对提取到的测量点云进行降噪和滤波处理;接着利用3D-SIFT特征点提取算法对测量点云和CAD模型点云进行特征点提取;最后把提取的特征点作为4PCS算法的初始值进行2种点云数据的配准。与常用的4PCS算法、Super-4PCS算法相比,在算法仿真与实际应用实验结果表明,本文算法在保证配准精度的前提下将配准速度提高30%以上。



    嵌入翻筋斗策略的自适应秃鹰搜索算法及其应用#br#
    夏煌智1, 2, 陈丽敏3, 毛雪迪1, 2, 祁 富1, 2
    2024, 0(02):  7-14.  doi:10.3969/j.issn.1006-2475.2024.02.002
    摘要 ( 19 )   PDF (4952KB) ( 40 )  
    参考文献 | 相关文章 | 计量指标
    摘要:针对秃鹰搜索算法(BES)容易陷入局部最优与求解精度低等问题,本文提出一种改进的秃鹰搜索算法。首先,通过Circle混沌序列取代原始算法中随机产生的初始种群,提升了初始种群的多样性;其次,在算法搜索选择空间阶段中,结合自适应权重对秃鹰个体位置进行更新,平衡算法的搜索与开发能力;最后,利用翻筋斗觅食策略更新后续阶段秃鹰领导者个体位置,并融入精英差分变异增强算法跳出局部最优的能力。在多个标准测试函数进行对比仿真实验,并应用改进算法对随机森林分类参数进行优化,实验结果表明,改进后的算法在求解效率方面有较大提升,且求解精度与分类准确率也优于传统算法。

    基于改进U-Net的髋关节关键点检测算法
    陈 震1, 姚京辉2, 苏成悦1
    2024, 0(02):  15-19.  doi:10.3969/j.issn.1006-2475.2024.02.003
    摘要 ( 29 )   PDF (1367KB) ( 86 )  
    参考文献 | 相关文章 | 计量指标
    摘要:使用骨盆X光片诊断发育性髋关节发育不良(Developmental Dysplasia of the Hip, DDH)要求准确地标注髋关节关键点,而深度学习方法能作为可靠的辅助工具。针对骨盆片拍摄姿势和拍摄距离多样化问题,本文基于U-Net提出了RKD-UNet来检测髋关节关键点。该模型使用残差块改进U-Net的卷积层和skip-connection路径,并将坐标注意力引入到编码器中以增强模型对关键点邻域的特征提取能力。在编码器顶部使用卷积和ASPP模块构成Bridge块,以[3, 6, 9]的空洞率融合不同尺度的特征信息并提升模型的感受野。本文使用包含骨盆正位片、蛙位片、下肢全长片和术后骨盆片的数据集训练和测试模型。RKD-UNet实现了3.19±2.19 px的平均关键点检测误差和2.83°±2.59°的平均髋臼角测量误差。对正常、轻度、中度和重度脱位案例诊断的F1分数分别达到89.6、77.1、57.9和94.1,高于医生的手动诊断结果。实验结果表明,RKD-UNet能准确检测髋关节关键点并辅助医生诊断DDH。
    基于稀疏重构的前视声纳成像方法
    徐云艳1, 郑 葳2, 刘建国3, 毕 杨4, 郭 拓1
    2024, 0(02):  20-28.  doi:10.3969/j.issn.1006-2475.2024.02.004
    摘要 ( 14 )   PDF (9653KB) ( 23 )  
    参考文献 | 相关文章 | 计量指标
    摘要:基于稀疏重构的DOA估计算法可以通过加强表示稀疏性而获得更高分辨的空间谱估计,有助于实现相邻目标的区分,本文提出一种在每个距离上稀疏重构的声纳成像方法。该方法利用声纳成像中目标本身具有的稀疏性,以及稀疏重构算法中的范数约束,来获得更高的分辨率以最终实现成像效果的改善。在仿真和水池实验中,将l1-SVD和SpSF稀疏重构算法与传统方位估计方法MUSIC、CBF、SFW-L21、NN-SpSF进行性能对比,实验结果表明l1-SVD算法和SpSF算法成像优于传统方法,有较窄的主瓣和较低的旁瓣,且对背景噪声有一定的抑制效果。同时,对2个相邻很近的目标,也可较好地区分出来,表明本文算法具有较高的分辨率。
    毫米波大规模MIMO-NOMA系统用户分簇和功率分配设计
    李旺旺, 黄学军
    2024, 0(02):  29-35.  doi:10.3969/j.issn.1006-2475.2024.02.005
    摘要 ( 17 )   PDF (2532KB) ( 26 )  
    参考文献 | 相关文章 | 计量指标
    摘要:针对多用户毫米波大规模多输入多输出-非正交多址接入(MIMO-NOMA)系统功率分配计算复杂的问题,提出新用户分簇和功率分配方案,提高系统的频谱效率。首先改进基于簇头选择的用户分簇方案,根据真实信道动态选择阈值并确定分簇数目,使分簇结果更适合实际情况,用户从波束中获得更大增益。然后以最大化系统频谱效率和能量效率的加权和为目标设计功率分配,使用改进的元启发算法求解。通过对粒子群(PSO)算法引入新的矢量成分和添加余弦扰动使算法更快收敛到全局最优值,并融合沙猫优化(SCSO)算法使算法结果更加精确。仿真结果表明,与现有算法相比,本文提出方案的频谱效率和能量效率优于传统方案,且更适合多用户情况。




    基于CRF的分区倒排索引压缩算法
    王子琛, 瞿有利
    2024, 0(02):  36-42.  doi:10.3969/j.issn.1006-2475.2024.02.006
    摘要 ( 10 )   PDF (1927KB) ( 32 )  
    参考文献 | 相关文章 | 计量指标
    摘要:倒排索引是大型搜索引擎的核心数据结构,本质是倒排列表中整数序列的集合。倒排索引压缩可以有效减少倒排索引所占空间,提高对关键词的检索效率。本文提出的基于条件随机场(CRF)的分区倒排索引压缩算法主要关注域值分区的分区方式。该算法对序列进行预分区,并且使用条件随机场对预分区进行标注并重组,有效减少了压缩时间。根据分区类型,该算法使用相应的编码方式,进一步减少了压缩后的空间占用。与其他倒排索引压缩算法进行对比实验分析,结果表明本文算法在压缩率上超过目前一些域值分区的算法,并且在解压时间上与其他域值分区算法相当。该算法在时间和空间上取得了较好的平衡。





    控制技术
    用于遥感图像目标检测的少样本算法
    薛杨义1, 周立凡2, 龚声蓉1, 2
    2024, 0(02):  43-49.  doi:10.3969/j.issn.1006-2475.2024.02.007
    摘要 ( 15 )   PDF (2327KB) ( 32 )  
    相关文章 | 计量指标
    摘要:针对遥感场景数据量匮乏,高空拍摄捕捉的地表物体尺寸变化明显,包含大量多个类别的物体以及复杂背景,导致检测准确率低、分类不准确等问题,提出一种基于二阶段检测模型(Faster RCNN)的少样本遥感目标检测网络。新增新型反转卷积算子构建检测器主干,提高特征提取能力;融入多尺度对象级正样本特征进行原始特征增强,抑制负样本的不利影响,充分挖掘各目标尺度的特征信息,帮助语义信息进行定位;采用对比监督的思想改进损失函数,细化目标分类,降低误检率。在公开遥感数据集上的实验结果表明,在仅有少量遥感标注样本的条件下,该网络能适应遥感图像的多尺度特征并有效缓解数据稀缺引发的过拟合现象。与先期Meta RCNN和FsDet网络相比,平均准确度进一步提升了3.8个百分点和2.5个百分点,为遥感领域的图像目标检测提供有意义参考。
    图像处理
    基于多尺度频率注意力的多阶段去雨算法
    吴甜甜, 李延恺, 刘 阳
    2024, 0(02):  50-55.  doi:10.3969/j.issn.1006-2475.2024.02.008
    摘要 ( 21 )   PDF (12157KB) ( 49 )  
    参考文献 | 相关文章 | 计量指标
    摘要:雨天气候下户外视觉系统捕获到的图像易受到雨纹的干扰,导致成像质量下降,影响后续视觉任务的进行。去除图像中的雨纹并获得高质量的图像对后续计算机视觉任务处理尤为重要。本文提出基于多尺度频率注意力的多阶段去雨算法,旨在去除单幅雨图像中的雨纹,恢复出高质量的图像。首先结合雨纹的多样性,设计多阶段去雨模型,将去雨过程分解成多个子过程,逐步去除雨纹;其次针对目前去雨算法中存在过平滑问题,改进长短期记忆循环网络实现多阶段去雨,引入频率注意力机制加强对雨纹的关注,设计多尺度特征提取方式表征全局信息;最后通过细节恢复模块加强对背景成分的保留。实验结果表明,在合成数据集和真实数据集上本文算法都能够有效去除雨纹并保留完整的背景信息,有较好的去雨效果。
    改进生成对抗网络的图像去雾算法
    刘彦红, 杨秋翔
    2024, 0(02):  56-63.  doi:10.3969/j.issn.1006-2475.2024.02.009
    摘要 ( 25 )   PDF (4948KB) ( 48 )  
    参考文献 | 相关文章 | 计量指标
    摘要:雾霾天气下,可见光透过大气层时发生散射和吸收,导致图像质量变差、信息遮挡或丢失。基于此提出改进生成对抗网络(GAN)的图像去雾算法,该算法在生成器和鉴别器对抗中学习生成去雾图像。在生成器中,提出一种3行多列的多尺度融合注意力网络(Grid-G),引入通道注意力和像素注意力,分别从不同角度处理图像的厚雾区域和高频区域。在鉴别器中,引入图像中的高低频信息构建融合鉴别器(FD-F),将其作为额外先验判别图像的来源。在RESIDE数据集对合成数据和真实数据进行实验,实验结果表明本文算法在峰值信噪比和结构相似度等方面均优于其余对比算法,取得了更好的去雾效果,有效改善颜色失真等问题。
    基于反向残差注意力的光流估计
    2024, 0(02):  64-68.  doi:10.3969/j.issn.1006-2475.2024.02.010
    摘要 ( 13 )   PDF (1600KB) ( 21 )  
    参考文献 | 相关文章 | 计量指标

    摘要:光流估计是视频理解和分析的一项基本任务。现有的许多方法直接将遮挡作为异常点剔除,从而提高模型计算光流的能力,但这也容易引起图像灰度不连续,导致光流估计失败。此外,物体高速运动造成的大位移问题一直是光流估计的难点。为了解决上述问题,本文提出一种用于光流估计的基于反向残差注意力的生成对抗学习框架(FlowTranGAN, FTGAN)。该框架通过设计一个反向残差注意力模块增强特征的空间信息,提高像素之间的匹配程度;并且利用基于U-Net的鉴别器来约束生成器,减少光流估计的误差和不连续性,提高模型的泛化能力。通过在KITTI-2015数据集和MPI-Sintel数据集上进行的实验,实验结果表明本文所提出FTGAN的有效性和优越性。
    人工智能
    基于语义分割的嵌套命名实体识别方法
    崔少国, 胡光平
    2024, 0(02):  69-74.  doi:10.3969/j.issn.1006-2475.2024.02.011
    摘要 ( 21 )   PDF (1307KB) ( 62 )  
    参考文献 | 相关文章 | 计量指标
    摘要:命名实体识别旨在从非结构化文本中提取实体,实体之间通常存在嵌套结构。然而,以往的研究大多只关注平面命名实体的识别,而忽略了嵌套实体。因此本文提出一种基于语义分割的嵌套命名实体识别方法,该方法将嵌套命名实体识别任务表述为一个语义分割任务。首先,计算单词和单词之间的元素相似性、余弦相似性以及双线性相似性;然后将3种相似性特征拼接作为一个图像输入到语义分割模型中,得到单词和单词之间的关系矩阵;最后,从关系矩阵提取出嵌套实体。实验结果表明,本文方法可以有效地识别出嵌套实体,在公开嵌套命名实体识别数据集GENIA上的F1值达到80.0%,优于现有大多数嵌套实体识别方法。
    基于扩张卷积融合时序特征异常行为检测
    马彩莎, 焦立男, 柳有权, 李 欣
    2024, 0(02):  75-80.  doi:10.3969/j.issn.1006-2475.2024.02.012
    摘要 ( 12 )   PDF (2029KB) ( 59 )  
    参考文献 | 相关文章 | 计量指标
    摘要:本文提出一个基于扩张卷积的多尺度融合行人原型和时空特征的深度自编码器网络。为了更好地利用视频中行人的时序特征,在编码器和解码器的潜在空间处添加一个双分支结构,分别是预测时空特征的递归神经网络分支和保存行人正常模式的记忆存储模块。为了增强行人特征提取,忽略背景信息影响,增加模型的泛化能力,在编码器中加入改进的空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)模块,并在卷积块中使用混合扩张卷积(Hybrid Dilated Convolution,HDC)原则,解决行人大小变化的问题,同时在解码器中引入多级残差信道注意力机制,获取更多的上下文信息。模型在数据集USCD Ped2,CUHK Avenue的曲线下面积(Area Under the Curve,AUC)分别达到了0.982,0.928。
    基于对比学习MocoV2的COVID-19图像分类#br#
    许跃雯1, 李 明1, 李 莉2
    2024, 0(02):  81-87.  doi:10.3969/j.issn.1006-2475.2024.02.013
    摘要 ( 17 )   PDF (3940KB) ( 56 )  
    参考文献 | 相关文章 | 计量指标
    摘要:肺炎是一种常见多发感染性疾病,老年人和免疫力较弱者容易感染,尽早发现有助于后期治疗。肺部病变的位置、密度和清晰度等因素会影响肺炎图像分类的准确性。随着深度学习的发展,卷积神经网络被广泛应用于医学图像分类任务中,然而网络的学习能力依赖训练样本的数量和标签。针对电子计算机断层扫描(Computed Tomography, CT)的肺炎图像分类研究,提出一种基于自监督对比学习的网络模型(MCLSE),可以从无标记的数据中学习特征,提高网络模型的准确率。本文模型(MCLSE)首先设计辅助任务,从无标记的图像中挖掘表征完成预训练,提高模型在向量空间中学习数据映射关系的能力。其次,使用卷积神经网络提取特征,为了有效捕获更高层次的特征信息选择SENet网络改进分类模型,建模特征通道的相关性。最后,用训练好的权重加载改进后的分类模型中,下游任务中使用标记数据再次训练网络。在公开数据集SARS-CoV-2 CT和CT Scans for COVID-19 Classification上进行实验,实验结果表明MCLSE对整体样本分类的准确率分别达到99.19%和99.75%,较主流模型有很大提升。
    基于多尺度特征及注意力机制的轻量化PCB缺陷检测方法#br#
    周永钦, 王 勇, 王 瑛
    2024, 0(02):  88-92.  doi:10.3969/j.issn.1006-2475.2024.02.014
    摘要 ( 18 )   PDF (2101KB) ( 32 )  
    参考文献 | 相关文章 | 计量指标
    摘要:针对PCB表面背景影响缺陷检测以及检测模型过大消耗资源的问题,提出一种可以有效提取多尺度信息和边缘信息的轻量化网络模型SL-Unet用于PCB表面缺陷检测。SL-Unet以U-Net结构作为主干网络,首先,利用U型残差结构捕获主干网络中每一维度的多尺度信息,加强浅层信息与深层信息的交流,并引入DropBlock模块提升模型的泛化能力;其次,利用解码器的边缘信息完成深度监督,并融入轻量级通道注意力模块提升边缘信息的特征依赖,以引导主干网络在提取特征时能感知缺陷的边缘信息;然后,通过边缘感知模块构建多级联合损失,用于整体模型的优化;最后,采用Leaky ReLU函数替换网络中的ReLU函数,提高模型对负区间的特征提取能力。实验结果表明SL-Unet的Dice系数、交并比、图像检测帧率和模型大小指标分别达到79.3%、67.4%、22 帧/s和3.46 MB,极大地保证了模型的轻量化并显著提升了PCB表面缺陷图像的检测精度。
    基于轻量化YOLOv4机场场面遥感图像目标检测方法#br#
    杨 轲, 董 兵, 吴 悦, 郝宽公, 彭自琛
    2024, 0(02):  93-99.  doi:10.3969/j.issn.1006-2475.2024.02.015
    摘要 ( 17 )   PDF (4815KB) ( 58 )  
    参考文献 | 相关文章 | 计量指标
    摘要:针对现有遥感图像目标检测方法存在深层CNN丢失局部特征信息、复杂场景检测精度低的问题,提出一种基于轻量化YOLOv4的目标检测方法。首先,采用轻量级神经网络Ghostnet替代YOLOv4中作为主干特征提取的CSPdarknet53网络;其次,为改善复杂环境检测能力,采用CycleGAN仿真夜间场景;再次,融合Transformer模块,使模型易于采集网络特征间关系和局部信息;最后,采用Adam优化器和K-means++筛选锚框的方式加速收敛速度,并以RSOD航空遥感数据集进行实例验证。实验结果表明本文算法较原YOLOv4的MAP值提高了6.65个百分点,参数量减小了84.7%,可以满足复杂场景下的机场场面航空器实时目标检测。
    基于多视图的知识感知推荐系统#br#
    王晓霞, 孟佳娜, 江 烽, 丁梓晴
    2024, 0(02):  100-107.  doi:10.3969/j.issn.1006-2475.2024.02.016
    摘要 ( 14 )   PDF (2064KB) ( 68 )  
    参考文献 | 相关文章 | 计量指标
    摘要:现在基于知识图谱的推荐方法中,大多采用单一用户或项目表示,存在用户兴趣干扰、信息不完全利用和数据稀疏的问题。本文提出一种基于多视图的知识感知推荐模型(Multi-view Knowledge-aware, MVKA)。首先,该模型在用户-项目图融合注意力机制捕获用户的兴趣表示;引入项目-实体图,设计图注意力网络进行特征提取获取项目的嵌入表示;然后在2个视图之间构造图视角的对比学习方法,最后进行求和和串联操作得到用户和项目的最终表示,并通过内积预测用户对项目的匹配分数。为了验证本文模型的准确性和计算效率,在MovieLens-1M、Book-crossing和Last FM公开数据集上进行了大量的实验,并且与其他传统方法和图神经网络模型相比,AUC和F1值评价指标均有明显提升,说明 MVKA模型可显著利用各种信息关系数据来改善知识感知推荐任务。
    考虑异强度相关性下多元退化系统的可靠性置信评估#br#
    缪思巧, 凡红梅, 袁非梦
    2024, 0(02):  108-113.  doi:10.3969/j.issn.1006-2475.2024.02.017
    摘要 ( 13 )   PDF (982KB) ( 28 )  
    参考文献 | 相关文章 | 计量指标
    摘要:针对具有多个性能退化模式的航空发动机工作系统,考虑个体差异性和差异强度相关性,提出一种基于随机相关性的可靠性置信评估方法。以具有随机效应的Wiener 随机过程和Gamma 随机过程分别对各性能退化失效过程进行描述,利用相关参数随机化的Copula函数对多元性能参数的相依程度进行建模,推导出基于Clayton Copula函数模型的可靠度置信区间界点解析表达式,采用边缘函数推断法通过2步优化估计模型中的未知参数,建立整体可靠度评估模型。结合航空发动机EGTM和ZVB2R性能的退化数据,建立整体可靠度模型,完成综合评估,得到寿命区间为(1.033×104,1.278×104)次循环数,实例验证了模型的可行性和准确性。
    信息系统
    基于数据驱动的离子源数据智能分析平台
    熊卿智1, 李 祥1, 2, 彭芳伟1, 金安安1
    2024, 0(02):  121-126.  doi:10.3969/j.issn.1006-2475.2024.02.019
    摘要 ( 17 )   PDF (2431KB) ( 32 )  
    参考文献 | 相关文章 | 计量指标
    摘要:食品安全是事关人们身体健康和生命安全的大事,食品药物残留检测技术是确保食品安全的重要手段。离子源数据封装与处理技术是影响食品药物残留检测质量的瓶颈。受国外软件功能限制,目前离子源数据只能在特定软件平台打开且操作受限。本文针对离子源离线模式数据获取以及处理方法等存在的问题,提出并开发基于数据驱动的离子源智能分析平台,构建简便、高效、准确的智能数据处理分析平台,实现离子源数据的快速获取与分析处理,打破国外软件技术壁垒,为国产离子源仪器设备更新改造提供了新的解决方案。