计算机与现代化 ›› 2025, Vol. 0 ›› Issue (11): 71-79.doi: 10.3969/j.issn.1006-2475.2025.11.009
摘要: 摘要:显著性目标检测(Salient Object Detection, SOD)是计算机视觉领域的一个重要研究方向,它旨在对场景中最能引起关注的目标进行识别和分割。单模态的SOD算法在图像信息受到光照、失焦等干扰后难以达到有效的检测结果,而多模态的检测算法存在特征信息差异大,跨模态特征融合有效性低,不同层级之间特征利用率低的问题。针对以上问题,本文提出一种改进的跨模态交互和多尺度聚合的SOD算法。该算法采用双循环的跨模态交互机制,在RGB图像特征与热红外图像特征之间以协作激励学习的方式融合,此外在同一层级的2种模态信息上采用信息感受野放大机制,融合不同维度的空间和通道信息。多尺度聚合机制挖掘网络模型不同深度的特征,进行传递和连接,将浅层的细粒度信息和深层粗粒度抽象信息聚合,最后得到目标检测结果。分别采用ResNet、VGGNet和DenseNet进行特征提取,通过实验对比三者的检测效果。在室外场景下的多种目标进行实验对该算法进行验证和定性、定量分析,结果表明该算法取得了较好的检测精度和检测效果,并且整体性能优于现有的SOD模型。
中图分类号: