Please wait a minute...

当期目录

    2025年 第0卷 第09期    刊出日期:2025-09-24
    上一期   
    人工智能
    打包推荐算法综述
    李雄清1, 2, 彭明田1, 2, 李永1, 2, 王骏飞1, 2, 刘德志1, 3, 卞宇轩1, 3, 柴阅林1, 3, 刘云韬1, 3
    2025, 0(09):  1-13.  doi:10.3969/j.issn.1006-2475.2025.09.001
    摘要 ( 128 )   PDF (975KB) ( 102 )  
    参考文献 | 相关文章 | 计量指标

    摘要:打包推荐通过组合多个相关联的商品、服务或内容,并从中优化出最优解进行推荐,能够满足用户的多方面需求。随着电子商务、旅游零售等领域的快速发展,打包推荐已成为提升用户体验和商业效益的重要手段。本文综述打包推荐算法的研究进展与应用现状。首先,明确任务定义、任务特性、任务挑战以及常用评测指标,其中任务挑战包括捆绑包整体性问题、捆绑包多样性问题、数据稀疏问题、冷启动问题以及捆绑包生成问题等。然后,将现有算法划分为基于数据挖掘的方法、基于传统机器学习的方法和基于深度学习的方法3个大类和7个子类,并深入分析各类方法的特点。接着,总结打包推荐领域常用的评测数据集。最后,对打包推荐算法的未来发展趋势进行展望。



    面向密集场景的PB-YOLOv7行人检测方法
    郭金豪, 王峰萍, 王浩琦
    2025, 0(09):  14-19.  doi:10.3969/j.issn.1006-2475.2025.09.002
    摘要 ( 119 )   PDF (2524KB) ( 87 )  
    参考文献 | 相关文章 | 计量指标

    摘要:针对复杂背景下的密集人群检测过程存在的检测速度低、定位不精确等问题,提出一种密集场景行人检测方法PB-YOLOv7。首先,使用基于PP-LCNet的网络代替原主干特征网络,利用深度可分离卷积来降低模型运算过程中的复杂度;其次,采用双向特征金字塔网络BiFPN的特征融合思想,增强特征融合网络对深层、浅层以及原始特征信息的利用,减少卷积过程中重要特征信息的流失;最后,引入CBAM注意力模块到连接处位置,加强算法的特征提取能力,以使网络关注有效的信息。实验结果表明,该改进算法在公开密集行人数据集WiderPerson下的mAP相比原始算法提升0.7百分点,FPS值提升1.6 f/s,实现检测精度和检测速度的平衡。


    配网旁路作业机器人目标位姿估计方法
    姚杰1, 殷洪海1, 汪大海1, 李润梓2, 张茜雯2, 郭毓2
    2025, 0(09):  20-26.  doi:10.3969/j.issn.1006-2475.2025.09.003
    摘要 ( 80 )   PDF (3498KB) ( 77 )  
    参考文献 | 相关文章 | 计量指标

    摘要:机器人代替人工完成旁路作业任务,需要其在复杂的作业场景下具有自主估计目标物体位姿的能力。针对旁路作业机器人在复杂背景和不同光照条件下目标位姿的实时估计问题,提出一种基于改进YOLO-6D且融合Transformer模型的6D位姿估计算法(RTFT6D),改进YOLOv8主干网络以提升推理速度,设计一种融合Transformer模型的特征加强网络,提升位姿估计的鲁棒性。实验结果表明,该算法在LINEMOD数据集上的精度超过了大多数基于RGB图像输入的位姿估计算法,并且针对不同光照条件下的配网旁路作业目标具有很好的位姿估计效果。


    基于自蒸馏和自注意力增强的低数据细粒度图像分类
    张婧颖1, 耿琳2, 刘宁钟2
    2025, 0(09):  27-34.  doi:10.3969/j.issn.1006-2475.2025.09.004
    摘要 ( 83 )   PDF (2223KB) ( 65 )  
    参考文献 | 相关文章 | 计量指标

    摘要:利用有限的数据训练细粒度图像分类(Fine-grained Image Classification, FGIC)模型是一项巨大的挑战,其类别之间的细微差异可能不易辨别。一种常用的策略是利用预训练的网络模型生成有效的特征表示。然而当使用有限的细粒度数据对预训练模型进行微调时,模型往往倾向于提取相关性较低的特征,从而引发过拟合问题。针对上述问题,本文设计一种新的低数据条件下的细粒度图像分类方法SDA-Net。该方法通过融合空间自注意力机制和自蒸馏技术优化特征学习过程,能有效减轻因数据稀缺导致的过拟合问题,提升深度神经网络在低数据环境下的性能表现。具体而言,SDA-Net通过引入空间自注意力将上下文信息编码为局部特征,改进类内表示。同时引入一个蒸馏分支并将蒸馏损失用于增广后的输入样本中,实现网络内部知识的深度增强与传递。在3个细粒度基准数据上进行了全面的评估,结果显示SDA-Net相较于传统的微调方法及当前最先进的低数据FGIC技术,均展现出了显著的性能提升。在3种10%的低数据场景下,与标准ResNet-50相比,相对精度分别提高了30%、47%和29%;与SOTA相比,相对精度分别提高了15%、28%和17%。



    改进YOLOv8的轻量化垃圾分类检测
    罗德艳, 徐杨, 左锋云, 张永丹
    2025, 0(09):  35-42.  doi:10.3969/j.issn.1006-2475.2025.09.005
    摘要 ( 96 )   PDF (1593KB) ( 85 )  
    参考文献 | 相关文章 | 计量指标

    摘要:目前基于深度学习的垃圾分类检测算法通常具有大量的模型参数,这会导致存储和计算成本上升,使得在资源受限的移动设备上运行时会产生较高的计算负载。针对以上问题提出一种改进YOLOv8n的轻量化垃圾检测算法。改进算法在YOLOv8n特征提取网络模块中使用GhostNet卷积模块实现轻量化网络;采用RepConv结构重参数化改进主干网络,增强网络特征提取能力的同时减小推理阶段网络的复杂度;改进颈部网络的C2f模块,使用不同尺寸的卷积核获取多尺度特征信息,从而提高模型检测精度;利用迁移学习提高网络泛化能力,并加速模型训练提高模型的检测精度。实验结果表明,改进后的模型参数量和计算量相较于原模型分别降低了26.8%和24.7%,平均检测精度mAP50和mAP50:95分别为98.1%和93.8%。改进算法不仅减少了模型的参数量和计算量,还具有较好的检测精度,能更好地适应移动设备的需求。


    基于改进YOLOv8-EDD的光伏板缺陷检测
    贾涛1, 吴月超2, 吕洋2, 付文龙3
    2025, 0(09):  43-49.  doi:10.3969/j.issn.1006-2475.2025.09.006
    摘要 ( 104 )   PDF (2104KB) ( 101 )  
    参考文献 | 相关文章 | 计量指标

    摘要:针对现有光伏板缺陷检测方法精度低、检测速度慢等问题,提出一种改进的YOLOv8-EDD光伏板缺陷检测模型。首先,引入多尺度注意力机制EMA,使YOLOv8模型能够更好地关注光伏板缺陷区域;其次,在原有C2f模块中引入可变形卷积DCNv2,增强模型对不规则缺陷形状的提取能力,同时为了缓解由于DCNv2参数量大导致模型检测速度降低的问题,使用DySample轻量级上采样算子替换YOLOv8原有上采样算子,以降低模型参数量和计算复杂度,提高模型的检测速度;最后,引入WIoUv3损失函数,降低低质量样本对模型精度影响,提高模型的泛化能力。实验中,改进的YOLOv8-EDD模型与原始模型相比精度提高了15.3百分点,召回率提高了11.3百分点,均值平均精度提高了10.5百分点,检测速度增长了6.5 FPS。结果表明,本文所提出的改进模型在提高检测精度的同时具有更快的检测速度,更适用于光伏板缺陷检测。


    信息安全
    一种基于量子安全直接通信的身份鉴权协议
    王松1, 李圆智2, 陈伟1, 卞宇翔3
    2025, 0(09):  50-54.  doi:10.3969/j.issn.1006-2475.2025.09.007
    摘要 ( 85 )   PDF (928KB) ( 58 )  
    参考文献 | 相关文章 | 计量指标

    摘要:为了确保身份鉴权的安全性,基于量子安全直接通信原理,提出一种不暴露身份验证密钥信息即可验证用户身份的鉴权协议。该协议使用单光子量子态作为载体,无需量子态存储器和任何纠缠光子源,从而提升量子身份鉴权协议在当前技术条件下的可行性。该协议由安全检测和身份鉴权2个阶段组成。在安全检测阶段,通信双方首先使用诱骗态序列来检测量子信道的安全,以抵御非法攻击。在身份鉴权阶段,通信双方通过身份鉴权序列来确认对方的身份。安全性分析表明,该协议能有效抵御常见攻击,为一个安全的量子身份鉴权协议。对比分析表明,该协议在实用性和有效性上相比于其他协议有一定优势。

    面向云计算数据传输的用户设备安全认证方法
    季秀兰
    2025, 0(09):  55-60.  doi:10.3969/j.issn.1006-2475.2025.09.008
    摘要 ( 80 )   PDF (1077KB) ( 65 )  
    参考文献 | 相关文章 | 计量指标

    摘要:提出一种面向云计算数据传输的用户设备安全认证方法。在云服务的支持下,利用安全断言标记语言建立统一的用户身份管理模型,以不同的断言传递方式作为依据,采用身份提供者拉方式和服务提供者推方式管理用户身份认证信息,实现对用户身份的灵活、高效管理。在此基础上设计用户设备认证方案,利用加密和校验算法,验证设备是否是合法的云服务商提供的服务终端,保护隐私信息的安全,同时实现云计算数据的访问控制。实验结果表明,提出的用户设备安全认证方法用户设备信任度高,并且在认证的各个阶段所需的计算量较少,在云计算数据传输的使用上,具有计算成本低、安全性高的优势。

    图像处理
    基于CycleGAN和注意力机制的人脸素描图像转换
    林睿姿, 姚达, 戴欣, 沈国誉, 王嘉慧, 万伟国
    2025, 0(09):  61-66.  doi:10.3969/j.issn.1006-2475.2025.09.009
    摘要 ( 62 )   PDF (3180KB) ( 77 )  
    参考文献 | 相关文章 | 计量指标

    摘要:近年来,人脸素描-照片合成技术因其在执法、刑事及娱乐等领域的需求,成为研究热点。CycleGAN作为一种无需配对图像监督的深度学习模型,擅长图像跨域转换,为素描与照片间的高效转换提供了有力工具。鉴于收集大量成对的人脸图像和素描图像存在较大难度,同时人脸素描图像生成任务中存在图像细节模糊和低清晰度的问题,提出一种改进的CycleGAN模型。本文在CycleGAN模型中ResNet架构的生成器的残差块中引入自注意力机制,使得 CycleGAN的生成器模型能够更有效地学习不同通道特征以及人脸图像中不同区域的重要程度,在处理图像时自动聚焦于面部特征的重要区域,如眼睛、鼻子、嘴巴等,同时增加素描的边缘清晰度与完整度,从而提升生成的人脸素描图像质量。在数据集CUHK和FS2K上进行实验,本文模型的图像质量评估指标结构相似性、峰值信噪比、多尺度结构相似度在数据集CUHK上分别为0.7741、11.7451、0.8504,在数据集FS2K上分别为0.7049、13.2745、0.7970,优于对比的CycleGAN、Pix2Pix、MUNIT、DCLGAN模型。对比实验以及主观视觉结果表明,本文模型能够有效地完成人脸素描化的过程,并生成较高质量的人脸素描图像。


    基于复杂环境的绝缘子缺陷检测
    季星宇1, 黄陈蓉2, 姚军财2, 王凯1, 顾铭杰1
    2025, 0(09):  67-72.  doi:10.3969/j.issn.1006-2475.2025.09.010
    摘要 ( 74 )   PDF (2019KB) ( 62 )  
    参考文献 | 相关文章 | 计量指标
    摘要:如今无人机已经广泛应用于电力巡检中,但由于绝缘子缺陷图像背景复杂,缺陷尺寸较小,并会出现闪络、自爆、破损等多情况损坏,大大限制了检测速度和精度,针对以上问题,提出一种基于改进YOLOv5的复杂环境的绝缘子缺陷检测方法。首先,采用改进后的特征提取网络C2FNet,在保证轻量化的同时获得更加丰富的特征信息。其次,采用具有多尺度信息的Res2Net模块,改善梯度传播和训练效果。最后,设计具有自适应融合的动态目标检测头3-DyHead,动态调整网络结构和参数。实验结果表明,本文方法平均精确度达到了94.2%,与原模型相比平均精确度提升了4.1百分点,查准率P和召回率R分别提升了3.2百分点和4.0百分点,绝缘子闪络、防震锤、破损的平均精确度分别提升了11.0百分点、2.0百分点和6.5百分点。


    基于多尺度语义调整的任意风格迁移方法
    祝露露, 谷林
    2025, 0(09):  73-78.  doi:10.3969/j.issn.1006-2475.2025.09.011
    摘要 ( 70 )   PDF (2765KB) ( 65 )  
    参考文献 | 相关文章 | 计量指标

    摘要:针对现有的任意风格迁移模型无法平衡生成图像中风格信息和内容信息的问题,本文提出一种改进的任意风格迁移模型。该模型在实施风格转化前整合了一个多尺度语义调整模块。此模块通过对风格特征映射和内容特征映射进行深度语义调整,强化关键特征表达,以改善风格迁移后图像内容结构与风格特征难以协调的问题。另外,本文还提出一种语义调整损失函数,旨在使网络能更精确地保留原始图像的内容结构,并更加细腻地迁移目标风格图片的风格信息。实验结果表明,本文所提出的方法在较好地保留图片内容信息的基础上,进一步提升了风格信息的迁移效果。


    基于视频时序特征的多模态隧道火灾检测
    杨添顺1, 宋焕生1, 梁浩翔2, 刘浩楠1, 马辛洲1, 孙士杰1, 张绍阳1
    2025, 0(09):  79-89.  doi:10.3969/j.issn.1006-2475.2025.09.012
    摘要 ( 69 )   PDF (4409KB) ( 60 )  
    参考文献 | 相关文章 | 计量指标

    摘要:隧道环境封闭且狭小,一旦发生火灾,火势蔓延和有害气体产生将严重威胁生命和财产安全。现有基于单帧图像的隧道火灾检测方法难以准确区分火焰与类似火焰的灯光。为解决这一问题,本文提出一种基于YOLOV网络的多帧序列特征提取方法,利用视频序列中目标的动态特征变化,设计VSDFD模块,通过相邻间隔帧的特征相似度来区分火焰与灯光。此外,结合温度传感器采集的环境温度信息,采用DST证据理论及其推导方法TBM,提出一种MFD多模态融合方法,用于计算火灾发生概率,实现隧道火灾检测。实验结果表明,VSDFD模块在区分火焰和灯光方面表现出显著效果,MFD方法在误检情况下将融合概率控制在0.5以下,而在火灾场景中融合概率则保持在0.5以上。与其他方法相比,本文方法在检测精度上平均提高了2.8百分点,漏检率降低了2.7百分点,误检率降低了5.2百分点,在多种实际隧道火灾情况下的实验,验证了本文方法检测火灾的准确性。

    基于Mask约束的单视图3D头发建模
    李谡, 李德权, 庆宇
    2025, 0(09):  90-96.  doi:10.3969/j.issn.1006-2475.2025.09.013
    摘要 ( 84 )   PDF (2373KB) ( 63 )  
    参考文献 | 相关文章 | 计量指标
    摘要:提出一种基于Mask约束的3D头发重建方法。首先,利用SAM推理出头发正视Mask,并通过GAN网络预测合理的后视Mask,引入深度伪标签微调Hourglass网络预测头发深度图,增强头发的相对位置关系,另外使用U-Net推理头发的方向图,将这些信息输入Stacked Hourglass网络,并且分别利用正视Mask和后视Mask约束生成三维头发空间点,确保生成的头发三维点云在Mask范围内投影合理。同时,通过控制负样本采样率,增强模型在头发边缘的鲁棒性。最后,采用并行算法加速头发合成,显著提高重建效率。实验结果表明,该方法在处理复杂发型和提高头发真实感方面效果显著。


    数据库与数据挖掘
    基于双重注意力机制的CNN-BiLSTM和LightGBM股票预测
    刘成, 冯广
    2025, 0(09):  97-103.  doi:10.3969/j.issn.1006-2475.2025.09.014
    摘要 ( 88 )   PDF (2738KB) ( 103 )  
    参考文献 | 相关文章 | 计量指标

    摘要:股票市场对于经济的发展至关重要,投资者根据它的剧烈波动性来精准地预测股票价格的变化,能有效降低投资风险,获得更高的收益。由于传统的时间序列模型如ARIMA在处理非线性问题时存在局限,其预测效果在股票市场中往往不尽如人意。本文提出一种创新的混合算法,融合双重注意力机制的CNN-BiLSTM与LightGBM技术,借助神经网络的强大非线性学习能力,实现股市波动的高效精准预测。在具体实施上,股票数据首先通过ARIMA模型进行预处理,随后采用卷积神经网络结合注意力机制,构建特征注意力模块,以自适应方式提取股票数据中的关键特征。接着,融合双向长短期记忆网络与注意力机制,构建时间注意力模块,对股票价格的未来趋势进行初步预测。最后,为了进一步优化预测准确性,模型引入LightGBM构建误差修正模块,精细化调整初步预测结果。实验表明,本文提出的模型不仅能够提升预测准确性,而且能够为投资者和机构提供强有力的决策支持,从而使他们能够更加敏锐地发掘市场机遇,达到最大化收益的目的。


    面向云边协同多源传输数据的知识联合提取
    尚博祥1, 郭晓艳2, 郑剑1, 孙先范2
    2025, 0(09):  104-108.  doi:10.3969/j.issn.1006-2475.2025.09.015
    摘要 ( 71 )   PDF (2565KB) ( 82 )  
    参考文献 | 相关文章 | 计量指标

    摘要:随着电力物联网多源非结构化数据传输量的增加,导致云边协同任务调度和资源分配具有极大的延迟性。对此,本文利用知识图谱在数据存储和知识抽取方面的优势,提出一种多模块联合知识提取方法,该方法包括2个独立的子模块,一个用于提取头部实体,另一个用于抽取尾部实体及其对应关系。首先通过枚举传输数据中的标记序列来生成候选实体和关系,然后使用2个子模块来预测实体和关系,最后对预测的实体和关系进行联合解码,得到关系三元组,并以传输数据包含的知识为依托,实现传输调度图谱的可视化展示。实验结果显示该模型的F1值达79%,精确度相较于其他传统方法提高6%,知识抽取效果较好,能够高效对非结构化传输数据进行高度解析,实现云边协同任务调度和资源分配的精准决策。



    FedLDP:本地化差分隐私下一种高效联邦学习方法
    成梦圆, 李艳辉, 吕天赐, 赵玉鑫, 黄臣
    2025, 0(09):  109-118.  doi:10.3969/j.issn.1006-2475.2025.09.016
    摘要 ( 59 )   PDF (4536KB) ( 56 )  
    参考文献 | 相关文章 | 计量指标

    摘要:联邦学习作为一种分布式机器学习框架,允许用户在不泄露原始数据的情况下通过共享模型参数来协作训练模型。然而,模型参数仍然可能包含大量隐私敏感信息,直接对其共享存在泄露用户隐私信息的风险。本地化差分隐私能够抵御具有任意背景知识的攻击者,为隐私信息提供更全面的保护。由于联邦学习的参数数据高维度和多轮次的特点,给本地化差分隐私应用于联邦学习带来了挑战。为此,本文提出一种满足本地化差分隐私的联邦学习算法FedLDP。该算法利用维度选择策略(EMDS)挑选出用于全局聚合的重要参数维度;采用拉普拉斯机制扰动所选的参数维度;为了提高模型的学习效率和整体性能,设计增量隐私预算分配策略调整迭代过程中的隐私预算分配方式,优化模型训练过程。理论分析证明FedLDP算法满足[ε]-本地化差分隐私。实验结果表明,在MNIST和Fashion-MNIST数据集上,FedLDP算法能够在相同级别的隐私约束下使模型准确率分别提升5.07百分点和3.01百分点,优于现有方法。

    结合可解释分析的多模型堆叠乳腺癌住院费用预测
    朱海玉1, 孙晓燕1, 袁贞明1, 杨丽静2
    2025, 0(09):  119-126.  doi:10.3969/j.issn.1006-2475.2025.09.017
    摘要 ( 95 )   PDF (2499KB) ( 61 )  
    参考文献 | 相关文章 | 计量指标

    摘要:住院费用是影响乳腺癌患者治疗选择和预后的因素之一,精准预测住院费用及个性化分析费用影响因素对于有效配置资源和优化医疗服务至关重要。针对单一模型在住院费用预测任务上存在泛化能力弱且可解释差的问题,本文提出一种可解释的堆叠方法,充分整合多种模型的特征提取能力,实现对乳腺癌患者住院费用的准确预测。该方法采用2层模型融合结构,第1层选择4个基模型,并利用贝叶斯优化和五折交叉验证技术优化参数,提高每个模型的预测性能,再由第2层线性回归输出最终的费用。此外,本文还使用SHAP和LIME方法从整体和个体角度分析乳腺癌住院费用预测结果。在某医院乳腺癌住院患者数据集上的实验结果表明,堆叠方法在费用预测任务中的R2为0.877,优于其他相关研究。可解释性分析结果表明,住院时长和治疗方式是影响住院费用的主要因素,但不同患者的影响因素存在个体化差异,这为更深入了解影响住院费用的关键因素提供了宝贵的见解。