Please wait a minute...

当期目录

    2024年 第0卷 第12期    刊出日期:2024-12-31
    上一期   
    人工智能
    基于意图的轻量级自注意力序列推荐模型
    何思达, 陈平华
    2024, 0(12):  1-9.  doi:10.3969/j.issn.1006-2475.2024.12.001
    摘要 ( 105 )   PDF (578KB) ( 109 )  
    参考文献 | 相关文章 | 计量指标
    现有序列推荐模型中自注意力机制计算参数量过大,同时没有充分考虑用户购物意图中的偏好信息。本文提出一种基于意图的轻量级自注意力序列推荐模型。该模型在传统的商品序列编码基础上,引入意图序列编码,进一步挖掘序列间转换模式;同时,为了降低序列中两两商品/意图间自注意力计算复杂度,设计卷积分段采样模块,将用户行为序列和意图序列分为多个片段,即将用户兴趣映射到多个序列片段中,应用自注意力机制捕捉片段间依赖关系,有效减少计算参数量。在MovieLens-1M、Yelp和Amazon-Books这3个公开数据集上进行对比实验,结果表明,相比基线模型,其命中率、归一化折损累计增益和平均倒数排名在MovieLens-1M数据集上提升了5.32%、4.40%和5.51%,在Yelp数据集上提升了30.93%、22.73%和28.84%,在Amazon-Books数据集上提升了7.78%、11.55%和13.98%,充分验证了本文所提模型的有效性。
    基于主题与描述信息的实体链接方法
    郑久超, 赵新元
    2024, 0(12):  10-14.  doi:10.3969/j.issn.1006-2475.2024.12.002
    摘要 ( 64 )   PDF (657KB) ( 81 )  
    参考文献 | 相关文章 | 计量指标
    实体链接被广泛应用于信息挖掘、问答系统等领域,对于构建知识图谱也有着重要意义。针对现在大多数实体链接方法对于候选实体的信息利用不充分,只是在全局模型中隐式地考虑各实体之间关系的问题,提出一种基于主题与描述信息的实体链接方法(TopDEL),通过实体的描述信息来辅助从提及上下文中筛选出对实体影响较大的词语;同时,在局部模型上使用BERTopic主题模型对文档进行主题提取,并利用主题下的词分布表示各个实体之间的关系,从而进行实体链接。在4个公共数据集上的实验结果表明,TopDEL方法有效。
    基于改进Stable Diffusion的时尚服饰图案生成
    赵晨阳, 薛涛, 刘俊华
    2024, 0(12):  15-23.  doi:10.3969/j.issm.1006-2475.2024.12.003
    摘要 ( 65 )   PDF (1223KB) ( 77 )  
    参考文献 | 相关文章 | 计量指标
    服饰图案是人们展示个性与时尚的窗口。近年来,随着多模态技术的不断发展,基于文本的服饰图案生成得到了充分研究。但现有方法由于结合语义性较差和分辨率不高等问题并未得到很好的应用。大规模语言-图像预训练模型CLIP提出后,各种预训练扩散模型结合CLIP做文本图像生成任务已成为该领域的主流方法。但原始预训练模型对下游任务泛化能力较差,单纯依靠预训练模型并不能灵活准确控制服饰图案的颜色和结构,且其庞大的参数量很难从头重新训练。为解决上述问题,本文设计一个基于Stable Diffusion改进的网络FT-SDM-L(Fine Tuning-Stable Diffusion Model-Lion),该网络使用服饰图像文本数据集,对原模型中的交叉注意力模块进行权重更新。实验结果表明,微调后模型的ClipScore及HPS v2分数平均提高了0.08和1.22,验证了该模块在结合文本信息中的重要能力。随后为进一步增强模型在服饰领域的特征提取和数据映射能力,在该模块输出位置设计添加一个轻量级适配器Stable-Adapter,最大限度地感知输入提示的变化。该适配器仅额外增加0.75%的参数就可使模型的ClipScore及HPS v2分数进一步提高0.05、0.38。模型在服饰图案生成的保真度和语义一致性上均取得良好效果。
    一种利用复合事件概率运算解决负信息抑制最大化问题的方法
    王晓航1, 李永杰1, 余雷1, 范萧2
    2024, 0(12):  24-33.  doi:10.3969/j.issn.1006-2475.2024.12.004
    摘要 ( 51 )   PDF (1197KB) ( 50 )  
    参考文献 | 相关文章 | 计量指标
    在线社交网络为人们提供通信便利的同时,也会广泛传播负面信息从而造成严重的负面影响。因此,亟需采取合理有效的策略来最大程度地抑制网络中负面信息的传播。本文在COICM模型上研究了负信息抑制最大化问题并基于局部影响入树结构设计求解节点正(负)激活概率的方法,进而提出一种启发式算法来求解此问题。核心思想为首先在局部影响入树中区分节点的状态,即节点在当前时刻被正或(负)激活,在当前时刻之前曾被正(负)激活和直到当前时刻保持不被激活,且5种状态组成该节点截至当前时刻发生事件的样本空间,然后利用复合事件概率的运算方法求出节点在当前时刻的被正(负)激活的概率表达式,以及通过递归计算求出根节点的负激活概率,最后将网络中所有节点的负激活概率之和作为负种子集的影响力。该算法使用贪心框架迭代选择负信息抑制最大的节点作为传播正信息的节点。在4种真实的不同规模的社交网络数据集上与现有算法进行对比分析,结果表明本文算法的负信息抑制效果更好,且能够适用于大规模网络。

    算法设计与分析
    基于WiFi和原型网络的手势识别方法
    黄庭培1, 马禄彪1, 李世宝2, 刘建航1
    2024, 0(12):  34-39.  doi:10.3969/j.issn.1006-2475.2024.12.005
    摘要 ( 93 )   PDF (1535KB) ( 72 )  
    参考文献 | 相关文章 | 计量指标
    WiFi的手势识别在无接触式人机交互中发挥着重要作用,然而现有基于WiFi的手势识别系统面临着数据量小和跨域性能差的挑战。为了解决上述问题,本文将采集到的原始WiFi信道状态信息(CSI)通过CSI Ratio去噪、提取相位并转换为CSI图像,将其转化为图像分类问题,然后将转化的图像输入到原型网络(PN)中进行小样本跨域手势识别,在PN特征提取网络中加入了增强的卷积注意力模块(CSI-CBAM)来提高手势的表征学习。在Widar3.0数据集上的实验结果表明,当支持集中的每个类别达到4个标记样本时,该系统在跨环境、跨用户、跨位置和跨方向上的平均识别准确率分别为93.54%、91.28%、91.99%和89.16%。跨域平均准确率大于90%,本文方法只需少量标记样本即可实现高精度的跨域识别。
    基于自编码器的网络流量异常检测
    吕美静1, 年梅1, 张俊1, 2, 付鲁森1
    2024, 0(12):  40-44.  doi:10.3969/j.issn.1006-2475.2024.12.006
    摘要 ( 73 )   PDF (629KB) ( 71 )  
    参考文献 | 相关文章 | 计量指标
    现有流量异常检测方案在面对日益复杂的网络流量和维度增加的数据结构时,存在误报率高、效率低以及实用性差等问题。针对这些问题,本文提出一种基于自编码器的网络流量异常检测模型。该模型首先基于随机森林算法对网络流量提取特征并筛选最优特征集,通过层次聚类算法将特征向量集划分为若干子集来降低特征维度;然后由自编码器并行处理特征子集并计算RMSE值,定义多次实验的最大平均RMSE值为正常流量阈值;利用测试数据的平均RMSE值和阈值判定异常流量。实验结果表明,本文模型召回率较传统的异常检测方法平均提高了4.3个百分点,运行时间降低了约37%。
    基于YOLOv7改进的PCB缺陷检测方法
    张思敏, 刘新妹, 殷俊龄, 李宝玲
    2024, 0(12):  45-52.  doi:10.3969/j.issn.1006-2475.2024.12.007
    摘要 ( 81 )   PDF (2764KB) ( 72 )  
    参考文献 | 相关文章 | 计量指标
    针对目前传统网络模型对PCB缺陷检测不准确、检测速度慢、识别精度低等问题, 提出了一种基于YOLOv7改进的PCB缺陷检测方法。首先,该方法在原YOLOv7模型基础上采用FasterNet中的部分卷积PConv代替CatConv,从而减少内存访问和参数量,提高检测速度;其次,将双向特征金字塔网络(BiFPN)引入到YOLOv7模型的头部网络,实现PCB缺陷的多尺度特征融合,提升模型的检测精度,再次,将FasterNet模块与BiFPN融合,形成YOLOv7+FasterNet+BiFPN的PCB缺陷检测模型,增强模型对缺陷的特征表达能力;最后,将原有的CIoU改进为XIoU损失函数,不仅提高了模型的收敛速度和对小目标边界框的扰动抵抗能力,也准确地衡量了边界框预测的准确性和定位精度。实验结果表明:改进后的YOLOv7模型在测试集上的mAP@0.5达到了95.7%,召回率为98.0%,相比于原YOLOv7模型mAP@0.5值和召回率分别提高了7、2个百分点,检测时间仅为21.7 ms,同时,FLOPs值与原模型相比计算量也减小了6.5 G。本文方法在检测速度、查全率和准确率等方面均优于传统网络,为PCB缺陷检测提供了有效的解决方案。
    基于经验小波变换的油气井产量预测模型  
    张晓东1, 白广芝1, 李敏1, 李昊洋2
    2024, 0(12):  53-58.  doi:10.3969/j.issm.1006-2475.2024.12.008
    摘要 ( 47 )   PDF (1321KB) ( 50 )  
    参考文献 | 相关文章 | 计量指标
    油气井产量预测对油气资源高效开发具有重要意义。针对间开生产等人工作业因素导致产量数据非线性强、预测难的问题,本文提出一种融合经验小波变换(EWT)和卷积双向长短期记忆网络的双通道产量预测模型。模型一部分采用EWT分解产气量数据,对分解后的子序列采用双向长短期记忆网络(BiLSTM)进行时域和频域特征提取;模型另一部分对多维历史生产数据采用一维卷积神经网络(1D-CNN)进行局部时序特征提取,然后使用BiLSTM并结合自注意力机制从1D-CNN模块的输出特征中挖掘气井生产数据的全局特征。最后,将模型的2个部分进行特征融合,生成最终预测结果。利用某气井生产后期历史数据开展实验建模分析,发现针对人工措施频繁的复杂产量序列本文方法预测结果更准确,表明了本文方法应用于油气田实际生产预测的可行性。
    多尺度时间编码的工业园区短期负荷预测
    王海洋, 弓同鑫, 杨锦涛, 陈再龙
    2024, 0(12):  59-65.  doi:10.3969/j.issn.1006-2475.2024.12.009
    摘要 ( 50 )   PDF (756KB) ( 58 )  
    参考文献 | 相关文章 | 计量指标
    针对工业园区短期负荷存在耦合性、非线性和随机性等问题,为了提升工业园区短期负荷预测精度,提出一种基于自编码器的自适应噪声完备集合经验模态分解和卷积神经网络-Transformer的短期负荷预测模型。考虑到真实场景中突发事件和紧急情况有时会造成负荷数据出现异常波动,首先,基于滑动时间窗口方法对异常数据进行检测与修正。其次,利用频域分解算法将历史负荷数据分为多尺度频域分量解决负荷数据的耦合性。再次,基于自编码器和特征工程方法生成与选取负荷波动相关性较大的外源特征与分量一起作为输入。然后,利用卷积神经网络对输入进行局部特征和潜在特征分析与特征融合,将结果输入Transformer网络,结合其编码能力和多头注意力机制捕获时间序列的特性。最后,叠加各子模块输出作为最终预测结果。结合真实负荷数据集进行实验验证,结果表明本文模型有效地提高了短期负荷预测精度。
    复杂施工场景下的安全帽佩戴检测算法
    刘云海1, 冯广1, 吴晓婷2, 杨群2
    2024, 0(12):  66-71.  doi:10.3969/j.issn.1006-2475.2024.12.010
    摘要 ( 65 )   PDF (1052KB) ( 58 )  
    参考文献 | 相关文章 | 计量指标
    针对在施工现场中存在复杂的背景干扰及异物遮挡,从而降低安全帽检测准确度的问题,提出一种复杂施工场景下的安全帽佩戴检测算法。本文改进YOLOv5算法,添加坐标注意力机制(Coordinate Attention, CA),使用Stem Block替换主干网络中的前2层,应用一个添加了坐标注意力机制的解耦检测头(Decoupled detect Head, DH)结构,同时添加额外的大尺度特征提取层。在安全帽数据集上的实验结果表明,改进后的CADH-YOLOv5算法平均检测准确度达到91.2%,能够显著改善复杂施工环境下的安全帽佩戴检测性能,优于同类算法,同时具有一定的实时性。
    图像处理
    基于注意力的DSMSC的遥感图像场景分类
    刘宝宝, 杨菁菁, 陶露, 王贺应
    2024, 0(12):  72-77.  doi:10.3969/j.issn.1006-2475.2024.12.011
    摘要 ( 66 )   PDF (1060KB) ( 52 )  
    参考文献 | 相关文章 | 计量指标
    针对遥感影像背景复杂且场景目标尺度信息不同导致模型分类准确度较低的问题,提出一种基于注意力的深度可分离多尺度扩张特征融合网络的遥感图像场景分类模型(Depthwise Separable Multi-scale Dilated Convolution, DSMSC)。首先,该模型基于深度可分离卷积构建特征提取模块,在提取影像深层特征的同时减少参数量;然后,通过多尺度扩张卷积模块增大网络感受野,获取图像的全局特征和关联特征;最后,利用注意力机制使网络关注重要的特征并将其输入到Softmax分类器进行分类。在遥感场景AID和WHU-RS19这2个数据集上进行验证,实验结果表明与AlexNet、VGG-16、ResNet18等模型相比,本文模型的准确率分别提高到93.32%和91.15%,同时具有较低的参数量,对遥感图像场景分类具有一定的应用前景。
    基于改进YOLOv8的SAR舰船目标检测算法
    谷岳, 邓松峰, 沈霁, 穆文涛, 赵恩棋
    2024, 0(12):  78-83.  doi:10.3969/j.issn.1006-2475.2024.12.012
    摘要 ( 97 )   PDF (1264KB) ( 71 )  
    参考文献 | 相关文章 | 计量指标
    为了提高SAR图像中舰船目标检测的准确性,特别是在面对目标大小不均、分布密集和复杂背景的挑战时,提出一种基于YOLOv8改进的YOLO-3M舰船目标检测算法。首先,算法引入多尺度膨胀卷积特征提取模块(Multiscale Dilated Convolution Block, MSDB)到主干网络中,使用多个膨胀率不同的卷积来提取多尺度特征,在不增加计算成本的情况下增大了感受野;其次,在颈部网络中引入多维度协作注意力机制(Multidimensional Collaborative Attention, MCA),在通道、高度和宽度3个维度上捕捉关键特征,实现不同维度信息的交互,帮助网络有效地关注到复杂背景中的关键部分;最后,在检测头引入MPDIoU损失函数,以应对现有损失函数在处理预测边界框与实际边界框时,尽管长宽比相同但宽度和高度数值完全不同时无法有效进行检测的问题。在SSDD数据集上的实验结果表明,本文算法在准确率和平均精度更高的同时,有效减少了参数量和计算量,使得模型更轻量并更适合于资源受限的环境,并且在复杂舰船的误检和漏检情况上有了显著的改善。
    中英文场景文本图像的检测和识别算法
    王艳媛, 茅正冲
    2024, 0(12):  84-90.  doi:10.3969/j.issn.1006-2475.2024.12.013
    摘要 ( 72 )   PDF (1514KB) ( 61 )  
    参考文献 | 相关文章 | 计量指标
    场景文本图像的背景复杂,检测算法难以定位文本区域,导致识别难度较高。为了同时检测和识别中文和英文的场景文本图像内容,并提高其检测和识别的准确率,提出一种基于ABCNetv2网络改进的算法模型TD-ABCNetv2。针对文本的形状、排列和字体等特征存在差异性的问题,该模型以SKNet作为骨干网络,引入选择性核函数SK模块,帮助网络学习不同尺度的特征,适应不同尺度、形状和方向的文本。考虑到中英文场景文本的字符大小和间隔不同,在FPN结构中增加ECA注意力模块,更有效地整合通道信息,增强网络对不同特征的敏感性,使得特征融合更有针对性。同时引入CIoU损失函数,更准确地衡量边界框之间的重叠程度,适应文本形状的变化,增强模型的泛化能力。通过在多个公开数据集上进行实验,结果表明了本文模型的有效性。
    信息系统
    无人帆船半物理仿真测试系统设计
    万兵1, 2, 3, 赵文涛4, 潘多涛1, 赵峥韬2, 3, 孙朝阳2, 3, 俞建成2, 3
    2024, 0(12):  91-99.  doi:10.3969/j.issn.1006-2475.2024.12.014
    摘要 ( 48 )   PDF (1610KB) ( 62 )  
    参考文献 | 相关文章 | 计量指标
    针对聚焦无人帆船电控系统的潜在漏洞,设计一种低成本的无人帆船半物理仿真测试系统。利用真实试验、假设或平台自身搭载传感器数据,验证特定工况下无人帆船下位机运行逻辑及硬件执行机构运行状况。为实际工程应用之前解决潜在漏洞提供参考方案。系统由现有“海鸥”号无人帆船电控系统及Python搭建上位机构成,以约定通信命令协议进行上下位机通讯。支持固定格式配置文件及测试数据文件,通过编写文件内容设计测试工况、流程及内容。基于“海鸥”号无人帆船已有海试数据,已验证不同工况无人帆船定向、定点及轨迹跟踪运行逻辑。该系统成本低、测试方式灵活、测试环境要求低及无需额外购置设备,在实际工程中具有可观的应用场景。
    基于毫米波雷达与视觉融合的电力现场安全帽佩戴检测
    陈亮, 李诚, 易伟, 熊伟, 汪晓帆, 唐海东
    2024, 0(12):  100-107.  doi:10.3969/j.issn.1006-2475.2024.12.015
    摘要 ( 69 )   PDF (1785KB) ( 52 )  
    参考文献 | 相关文章 | 计量指标
    针对目前纯视觉方案的安全帽检测算法难以兼顾精度与实时性的问题,本文利用毫米波雷达与视觉融合技术,提出一种基于嵌入式设备实时检测电力作业人员是否佩戴安全帽的智能识别算法。首先,对毫米波雷达和相机数据进行空间和时间融合;其次,基于目标生命周期方法对雷达数据进行有效目标筛选,设计状态滤波粗检测作业人员,并计算出图像感兴趣区域(ROI)映射到图像;然后,对多ROI的情况设计去重与合并方法;最后,基于YOLOv5模型,采用改进的轻量级网络ShuffleNetv2作为骨干网络,提高网络运行速度,在ROI中对人员是否佩戴安全帽进行检测。在电力现场搭建实验平台并将该方案与现有的纯视觉方案进行对比实验,结果表明该方法在检测精度有所提高的同时,实时性大幅提升,可以在作业现场实现基于嵌入式设备的实时检测。
      超短时电力负荷预测技术研究进展
    邬秀玲1, 周盛1, 王春娟1, 余萃卓2, 刘昊3
    2024, 0(12):  108-115.  doi:10.3969/j.issn.1006-2475.2024.12.016
    摘要 ( 59 )   PDF (573KB) ( 57 )  
    参考文献 | 相关文章 | 计量指标
    超短期预测在许多领域有广泛的应用场景。超短期电力负荷预测对于电力的实时调度、资源分配具有重要意义。合理的电力调度能够提升居民的用电体验,同时避免资源浪费。随着我国用电结构越来越多样化,对电力负荷进行准确的预测逐渐成为了难题。本文介绍超短期电力负荷预测的应用场景以及当前面对的困难与挑战,从技术层面将目前主流超短期电力负荷预测使用的方法分为传统预测方法、智能预测方法和组合预测方法,并对每一类方法内的模型按照实现方式进行细分和归类,随后在介绍过程中对部分典型模型的原理进行解释,最后,对比总结3类方法的优缺点,以表格的形式直观展示文中提到的部分模型的特点,并对未来超短期电力负荷预测的研究方向提出合理的建议。
    基于状态感知数据平面的SDN故障检测与恢复方案
    肖军弼, 邱艺
    2024, 0(12):  116-123.  doi:10.3969/j.issn.1006-2475.2024.12.017
    摘要 ( 47 )   PDF (649KB) ( 48 )  
    参考文献 | 相关文章 | 计量指标
    SDN网络中节点或链路发生故障时的处理策略通常基于静态的流表规则,受到SDN数据平面与控制平面分离架构的限制,不允许在数据平面存储任何网络流的状态信息,导致数据平面缺乏故障自主决策能力。针对此问题,本文提出一种基于状态感知数据平面的SDN故障检测与恢复方案SAFDR。SAFDR定义数据平面的数据流处理原语与状态转换关系,形成状态感知数据平面故障检测与恢复方法,以提高数据平面处理灵活性与故障时的自适应能力。SAFDR中提出的链路质量分析模型根据网络状态动态更新备用链路集合,可以有效解决网络动态变化引起的链路拥塞问题。仿真实验结果表明SAFDR满足电信级故障恢复时间要求,并且较其他故障恢复解决方案有更高的链路利用率。