Please wait a minute...
主 管:江西省科学技术厅
主 办:江西省计算机学会
江西省计算中心
编辑出版:《计算机与现代化》编辑部
Toggle navigation
首页
期刊介绍
编委会
在线期刊
最新录用
当期目录
过刊浏览
阅读排行
下载排行
引用排行
期刊订阅
常见问题及解答
自荐审稿
联系我们
Email Alert
English
在线办公
作者投稿查稿
专家在线审稿
主编在线审稿
编辑在线办公
投稿要求
更多>>
投稿须知
投稿流程
论文模板
版权转让协议
作者变更申请书
推荐文章
更多>>
友情链接
更多>>
中国知网
万方数据知识服务平台
维普网
中国科学文献服务系统
江西省计算机学会
江西省科学技术厅
新闻出版统计信息管理系统
出版专业技术人员职业资格登记注册管理系统
中国版本图书馆
公众号
访问统计
总访问量
今日访问
在线人数
当期目录
2025年 第0卷 第07期 刊出日期:2025-07-22
上一期
图像处理
基于领域生成和对比学习的人脸活体检测
张山鹿1, 张伟2
2025, 0(07): 1-8. doi:
10.3969/j.issn.1006-2475.2025.07.001
摘要
(
114
)
PDF
(3017KB) (
144
)
参考文献
|
相关文章
|
计量指标
摘要:人脸活体检测是保障人脸识别系统安全性的重要手段。现有的人脸活体检测方法在跨数据集测试场景下泛化性较差,导致性能急剧下降。针对这一问题,本文提出一种基于领域生成和对比学习的人脸活体检测方法。本文方法主要包含2个新颖的模块:源域生成模块和对比学习模块。前者首先在图像级将不同源域中人脸图像的局部区域进行随机交换以生成伪源域样本;然后,将上述人脸图像在特征级进行重组,即交换图像级重构对应位置的局部特征。通过最大化重构样本的特征和重组特征的相似性,该模块能够在扩充样本数量和攻击类型的同时,确保所生成的伪源域的稳定性,为本文方法学习泛化的特征空间提供良好的数据基础。后者则最小化真实人脸表示的类内距离,并在最大化真实人脸和欺骗人脸的类间距离的同时,最大化真实人脸和重构样本的类间距离,有效促进真实人脸表示的类内紧凑,确保本文方法能够学习良好的决策曲线。将本文方法在4个公开的人脸活体检测数据集CASIA-FASD、Replay-Attack、MSU-MFSD和OULU-NPU上进行训练和测试,实验结果表明在跨数据集测试场景下具备良好的泛化性能。
基于轻量化YOLOv8的无人机对绝缘子缺陷检测
江志伟1, 傅晓锦1, 陈文彬1, 江毅晨2
2025, 0(07): 9-14. doi:
10.3969/j.issn.1006-2475.2025.07.002
摘要
(
82
)
PDF
(2897KB) (
256
)
参考文献
|
相关文章
|
计量指标
摘要:针对复杂背景下绝缘子串以及绝缘子自爆、破损、闪络缺陷尺度不一、小目标因素,导致误检、漏检从而检测精度不高的问题,提出一种CPCW-YOLOv8算法。首先,在主干部分引入轻量级CBAM注意力机制,使模型从通道和空间2个方面增强复杂背景下的绝缘子串以及绝缘子缺陷特征的提取能力;然后,增加小目标检测层,利用多尺度融合增强网络对浅层语义信息的提取,捕捉更多的绝缘子缺陷细节,提高小目标的检测精度。其次,为了能够使模型更加轻量化,构建一种轻量化模块C2f-Faster。最后,将原有CIoU优化为WIoU,加速收敛并提高检测精度。实验结果表明,相对于原始模型,CPCW-YOLOv8参数量降低了12.6百分点,平均精度均值提升了5.2百分点。该网络的提出对电力系统绝缘子缺陷检测提供了一种更高效的方法。
基于ConvNeXt和注意力的多动症分类
汪涛1, 吴茜1, 2
2025, 0(07): 15-20. doi:
10.3969/j.issn.1006-2475.2025.07.003
摘要
(
69
)
PDF
(1466KB) (
118
)
参考文献
|
相关文章
|
计量指标
摘要:注意缺陷与多动障碍(Attention Deficit and Hyperactivity Disorder, ADHD)俗称多动症,是一种常见的儿童行为异常性疾病。由于目前多动症尚无明确病因,且多动症患者与正常儿童的脑部结构仅存在细微差异,导致临床医生难以进行有效诊断。针对此类疾病,本文提出一种基于ConvNeXt和注意力机制的卷积神经网络,用于区分多动症患者和正常儿童。首先对结构磁共振图像进行预处理,其次加载预训练模型,通过包含多维协作注意力的ConvNeXt网络进行深层特征提取,重构ConvNeXt输出层并得到最终分类结果。在ADHD-200数据集上进行验证,实验结果表明,其分类准确性达到97.3%,优于目前的主流方法,并且模型的热力图提示了前额叶等与疾病相关的脑部区域,因此可以作为一种有效、便捷的多动症辅助诊断方法。
多模态大语言模型在色素性皮肤病变诊断中的应用
孙凯杰, 胡继礼
2025, 0(07): 21-27. doi:
10.3969/j.issn.1006-2475.2025.07.004
摘要
(
91
)
PDF
(2898KB) (
112
)
参考文献
|
相关文章
|
计量指标
摘要:精准诊断色素性皮肤病变是一项复杂且具有挑战性的任务。在当代医疗环境中,智能自动化诊断工具可以显著提高诊断和治疗的准确性。本文提出一种创新的多模态大语言模型——SkinCPM-V,以应对皮肤镜图像中的纹理、毛发和血管结构带来的诊断挑战。SkinCPM-V基于MiniCPM-V进行深度优化,特别针对皮肤病变的特点进行定制化处理,并在Kaggle公开的皮肤病数据集上进行深度处理,采用LoRA技术实现高效的参数微调。对SkinCPM-V的全面评估显示,其在BLEU-4、ROUGE-1、ROUGE-2和ROUGE-L指标上分别获得了0.8880、0.9380、0.9104和0.9349的高分,表明生成文本与标准答案高度一致。模型在实际诊断任务中的性能也通过F1分数(0.9067)、精确率(0.9028)和召回率(0.9444)得到验证,表现优异。与同类多模态大语言模型相比,SkinCPM-V在各项评估指标上均表现突出,显示了其在生成高质量文本描述方面的优势,并在实际医疗环境中展现出其潜在应用前景。研究结果验证了SkinCPM-V在色素性皮肤病变诊断中的潜力,并为多模态大语言模型在医学领域的应用提供了新思路,有望推动医疗诊断技术的发展。
网络与通信
基于RA-CNN与ResNet的安卓恶意应用检测
华漫, 刘小亮
2025, 0(07): 28-32. doi:
10.3969/j.issn.1006-2475.2025.07.005
摘要
(
92
)
PDF
(1641KB) (
82
)
参考文献
|
相关文章
|
计量指标
摘要:近年来,基于字节码图像与深度学习的安卓恶意软件检测方法日益流行,但这类方法存在特征提取受限,对噪声数据敏感的问题。针对这一问题,本文提出一种融合残差网络(ResNet)与递归注意力卷积神经网络(RA-CNN)的检测方法。该方法首先从软件样本中提取DEX、XML与ARSC这3种字节码文件并将其映射为RGB图像,而后利用嵌入残差结构的卷积神经网络进行特征抽象与提取,随之注意力建议子网络(APN)以特征图作为参考从粗到细迭代地生成局部区域注意力,而更精细的尺度网络以循环的方式从之前的尺度中放大被关注的区域作为下一尺度的输入,通过多尺度学习后实现分类。实验表明,与类似的基于字节码图像方法相比,该方法在多种指标上均有所提升,准确率达到了98.28%。
基于多匿名器架构的用户位置双重隐私保护算法
何丽丽1, 2, 张成林1, 2, 张磊1, 2, 曹明增1, 2
2025, 0(07): 33-42. doi:
10.3969/j.issn.1006-2475.2025.07.006
摘要
(
54
)
PDF
(1308KB) (
94
)
参考文献
|
相关文章
|
计量指标
摘要:随着基于位置服务(LBS)的普及和发展,用户位置数据的隐私保护已成为一个紧迫的问题。针对现有的基于匿名的隐私保护仍面临匿名位置和查询内容中的语义信息对匿名安全性问题的挑战,基于可验证秘密共享算法提出一种多匿名器架构的双重隐私保护算法(Dual Privacy Protection Algorithm based on Multi-Anonymizer Architecture, MAA-DPPA)。与现有算法不同,该算法通过集成位置匿名和查询加密来增强位置隐私保护。首先,提出可验证秘密共享和多匿名器的查询加密算法,以增强查询安全性。其次,设计一种匿名方法,通过满足个人语义多样性的匿名位置和替换敏感语义位置来增强语义位置隐私。实验结果表明,MAA-DPPA隐私性最高,MAA-DPPA在多个条件下相对于基于道路网络语义多样性的匿名集构造的算法的平均提高百分比范围在38.3%~59.8%,且相对于基于语义和权衡感知的提高范围在51.1%~76.5%,MAA-DPPA算法在提高隐私保护性的同时显著提升了算法效率,验证了其在用户位置隐私保护中的有效性。
网络中断检测技术综述
邝野1, 周末2, 刘策越1
2025, 0(07): 43-54. doi:
10.3969/j.issn.1006-2475.2025.07.007
摘要
(
71
)
PDF
(1401KB) (
66
)
参考文献
|
相关文章
|
计量指标
摘要:随着网络的普及和发展,网络中断已成为摆在学术界和工业界面前迫切需要解决的问题,网络中断检测也因此成为当前的一个研究热点。大规模的网络中断事件将严重影响网络服务以及基础设施的正常运行,而深入了解网络中断有助于加强人们对网络状态的掌控。根据最新网络中断检测技术的研究进展,本文给出网络中断的定义和原因,并揭示网络中断引发的安全威胁;总结现有的网络中断检测技术,剖析其利弊;概括现有的用于网络中断检测的数据采集平台;最后,对网络中断检测的未来研究进行展望,为后续网络安全相关研究的开展提供参考。
人工智能
基于优化Transformer的长短期空气污染物浓度预测
蔡博涵, 刘俊
2025, 0(07): 55-62. doi:
10.3969/j.issn.1006-2475.2025.07.008
摘要
(
78
)
PDF
(3652KB) (
340
)
参考文献
|
相关文章
|
计量指标
摘要:针对空气污染物浓度预测精度低、时效短、时空特征捕获难的问题,提出一种基于条件掩码注意力机制(Conditional Mask Self-attention)的Transformer架构—CondMSA-Transformer。对Transformer模型中的多头自注意力机制进行改进,引入稀疏注意力机制的理念,结合风速、风向等关键环境因素,实现对非必要站点数据的智能“掩码”,聚焦于时空维度内最具价值的信息提取,避免远程站点弱信号的干扰,降低计算复杂度,同时增强模型对核心特征的捕捉能力。通过对北京2组真实数据集进行全面的实验评估,实验结果表明,CondMSA-Transformer在短期甚至长期预测场景中的稳健表现,与其他现有方法比,在PM2.5预测的均方误差(MAE)方面提供了高达14.67%的改进,展现出其在空气污染物浓度预测领域的应用潜力及先进性。
不同视角三维人体关键点动作相似度计算
李子贺, 王一丁
2025, 0(07): 63-68. doi:
10.3969/j.issn.1006-2475.2025.07.009
摘要
(
78
)
PDF
(3461KB) (
217
)
参考文献
|
相关文章
|
计量指标
摘要:目前线上健身、舞蹈教学视频资源丰富,但学员在学习过程中为比较与教学的动作自行拍摄的视频无法保证与教学的视角一致,会有角度和尺度的差异,不便于比较动作相似度。针对此问题,本文利用现有的三维人体姿态估计技术,提出一种可以用于不同视角下的单目摄像头拍摄的视频的动作相似度评估算法。对于2个不同视角的人物动作视频,首先用YOLOv8pose网络提取二维人体关键点,然后用GraphMLP网络升维成三维关键点。基于2组三维关键点序列计算欧氏距离矩阵,用DTW算法找出2组动作的对应帧,将对应帧的三维关键点通过旋转、放缩等手段调整视角,将不同视角的动作序列调整到同一方向,最后采用骨骼向量的余弦相似度作为相似度评判指标。利用不同视角的动作捕捉动画进行实验,验证了本文方法的有效性。
基于自注意力机制说话人编码器与SA-Decoder的
语音克隆方法
焦乐岩, 朱欣娟
2025, 0(07): 69-76. doi:
10.3969/j.issn.1006-2475.2025.07.010
摘要
(
79
)
PDF
(2428KB) (
276
)
参考文献
|
相关文章
|
计量指标
摘要:FreeVC模型在语音克隆技术领域表现出色。但是由于语音序列中包含复杂的语音特征变化和信息,例如音色、风格等,FreeVC模型中的Speaker Encoder模块只使用单一的LSTM网络难以准确地提取和表示说话人信息,这会导致模型处理语音序列的性能下降,影响声音转换质量和准确性。并且FreeVC模型使用传统的解码器,其中上采样(反卷积)操作细节丢失,导致重建还原的音频咬字细节会模糊不清,从而产生音频伪影。针对这些问题,本文提出一种基于自注意力机制的说话人编码器与SA-Decoder的语音克隆方法FreeVC-SA。该方法将说话人的梅尔谱作为输入,在LSTM网络上加入自注意力机制有助于模型更好地捕捉长距离依赖关系,更为准确地提取说话人的音色、风格等特征。使用SA-Decoder可以很好地解决局部感受野限制问题,使得重建生成的语音克隆效果更加真实、清晰。实验结果表明,与所有基线模型相比,FreeVC-SA语音克隆的自然度相似性和情感相似性均有明显提升,字错误率和字符错误率均有明显下降。
基于改进鲸鱼算法的Bi-LSTM电力负荷预测
饶弘宇1, 陈馨2, 陈胜3, 夏天3, 沈力4, 吕广强5
2025, 0(07): 77-82. doi:
10.3969/j.issn.1006-2475.2025.07.011
摘要
(
79
)
PDF
(1702KB) (
306
)
参考文献
|
相关文章
|
计量指标
摘要:新能源并网后电力系统稳定运行的关键是电力负荷预测的准确性。为此本文提出一种基于双向长短期记忆神经网络结合注意力机制的电力负荷预测模型。针对神经网络中超参数难以选取最优的问题,采用鲸鱼算法对超参数进行优化设计。为解决鲸鱼优化算法全局搜索和局部开发分配不均的问题,提出一种用分段非线性收敛因子调节的方法;同时对其后期开发能力不足的问题,提出一种自适应权重和随机差分变异组合方法,以实现超参数的优化。通过仿真验证了本文所提方法在超参数设计上的有效性,并验证了基于改进鲸鱼算法的电力负荷预测的准确性和有效性。
基于文本引导的多模态情绪识别
翟俊龙, 谷林
2025, 0(07): 83-89. doi:
10.3969/j.issn.1006-2475.2025.07.012
摘要
(
57
)
PDF
(1853KB) (
89
)
参考文献
|
相关文章
|
计量指标
摘要:多模态情绪识别在人工智能、安全驾驶等领域已经有广泛的应用,多模态信息拥有丰富的模态表征,对情绪识别更精准。文本是表达信息较丰富准确的模态,本文提出一种由多尺度文本特征引导优化的多模态情绪识别模型,即由不同尺度的文本特征聚合优化其他模态的特征,设计由文本引导的多模态聚合模块AGG,并在损失函数的设计中引入对比学习的思想优化整个网络。各实验指标显示本文模型在多模态情绪识别上表现出色,并通过对比实验和消融实验进一步验证本文设计的合理性和有效性。
融合Bi-LSTM残差网络的充电设施复杂故障诊断方法
邓超1, 2, 杨凤坤1, 2, 李珺3, 陈良亮1, 2, 郭志冲4
2025, 0(07): 90-96. doi:
10.3969/j.issn.1006-2475.2025.07.013
摘要
(
66
)
PDF
(1360KB) (
167
)
参考文献
|
相关文章
|
计量指标
摘要:随着电动汽车的快速发展,充电设施的可靠性和安全性成为保障用户安全和提升用户体验的关键因素。针对传统故障诊断方法因数据标注不足而无法适用于复杂故障诊断的局限性,从充电设施的维修工单和历史运营工单的角度,提出一种融合Bi-LSTM残差网络的充电设施复杂故障诊断方法。该方法通过提取原始订单与工单中的有效特征,利用残差网络将Bi-LSTM的时序特征与原始特征进行融合,最终将融合的特征输入至机器学习模型中实现充电设施复杂故障诊断任务。实验结果表明,该方法较机器学习模型在复杂故障诊断任务上均有明显的提升效果。
算法设计与分析
HGAT:基于混合图注意力网络的多变量时序异常检测
魏青松1, 王晓峻2, 魏源1, 曾尚琦1, 方园1
2025, 0(07): 97-105. doi:
10.3969/j.issn.1006-2475.2025.07.014
摘要
(
62
)
PDF
(2923KB) (
354
)
参考文献
|
相关文章
|
计量指标
摘要:在许多复杂的系统中,设备通常被网络传感器和执行器监控并产生大量的多元时间序列。如何精确地捕获传感器之间的复杂关系,并针对偏离这些关系的异常情况进行检测与阐释,已成为当前技术领域亟待攻克的难题。为了充分利用时空依赖关系和增强异常的可解释性,本文提出一种基于混合图注意力网络的多变量时间序列异常检测(HGAT)方法。首先,HGAT使用嵌入向量相似性构建特征图注意力网络(F-GAT)和时间图注意力网络(T-GAT)。然后,通过并行地应用F-GAT和T-GAT这2个图注意力层来学习特征维度和时间维度的非线性依赖关系。最后,HGAT联合优化基于预测和基于重构的模型,利用联合优化后计算的异常分数识别异常,以增强异常检测的可解释性。在SWaT、WADI和SMD数据集上的实验结果表明,HGAT优于最佳基线方法GDN,其F1分数分别提高了2.73百分点、3.39百分点和0.9百分点。
基于改进RT-DETR的轻量级火焰检测算法
吴栋, 范永胜, 桑彬彬
2025, 0(07): 106-111. doi:
10.3969/j.issn.1006-2475.2025.07.015
摘要
(
70
)
PDF
(7481KB) (
421
)
参考文献
|
相关文章
|
计量指标
摘要:为了提高火焰检测的精度,同时让模型更加轻量化,提出一种轻量级RT-DETR火焰检测算法。首先,选择EfficientVit作为特征提取网络,减少模型计算量与复杂度。其次,设计一种高效混合编码器,旨在降低模型参数量和计算量的同时,保持检测精度。该编码器由LPE-AIFI模块和CGAFusion模块组成,其中LPE-AIFI模块专注于处理深层特征,而CGAFusion模块通过多尺度特征融合提高模型的检测能力。最后,引入边界框回归损失函数MDPIoU,进一步提高算法精度。实验结果表明,改进后的模型浮点运算数(FLOPs)比原始模型减少了48.8%,参数量减少了43.4%。在达到轻量化的基础上,mAP@0.5值达到88.6%,mAP@0.5:0.95达到67.4%,相较基准模型分别提升了2.2百分点和2.7百分点。
融合自注意力的Bert-BiGRU-CRF的文本因果关系抽取
高宁波, 张晓滨
2025, 0(07): 112-118. doi:
10.3969/j.issn.1006-2475.2025.07.016
摘要
(
66
)
PDF
(1745KB) (
90
)
参考文献
|
相关文章
|
计量指标
摘要:针对自然语言文本因果关系抽取中存在的标记方案无法处理重叠关系以及长距离依赖性的问题,本文引入tag2triplet算法来处理同一句子中的多个因果三元组和嵌入式因果关系的因果三元组,并将因果性标记方案与深度学习架构相结合用以最小化特征工程,同时有效地对因果关系建模。此外,本文将自注意力机制融合到Bert-BiGRU-CRF模型中以学习因果关系之间的长距离依赖性,允许信息在网络中自由流动,从而更准确地提取因果关系。为了验证该方法的有效性,将模型与目前广泛使用的BiLSTM-softmax模型、BiLSTM-CRF模型和Flair+CLSTM-BiLSTM-CRF模型在SemEval 2010 task8数据集上进行对比实验,结果表明,本文模型的F1评价指标分数更高,达到了83.44%。
基于HSIC Lasso的特征加权支持向量机
赖志勇, 汪廷华, 张昕
2025, 0(07): 119-126. doi:
10.3969/j.issn.1006-2475.2025.07.017
摘要
(
74
)
PDF
(3224KB) (
116
)
参考文献
|
相关文章
|
计量指标
摘要:支持向量机(SVM)通过引入核函数将原低维问题转化为高维核空间线性问题,已成功应用于数据分类等问题。经典的SVM算法平等对待所有的特征,忽略了不同的特征对模型输出的贡献不一样的事实,因此,核空间的构造可能不尽合理。本文提出一种基于希尔伯特—施密特独立性准则(Hilbert-Schmidt Independence Criterion, HSIC)Lasso的特征加权支持向量机算法HSIC Lasso-FWSVM。该算法首先利用HSIC有效地度量2个随机变量之间的关系,计算特征空间中特征与特征以及特征与标签之间的相关性,使用计算出的相关性作为对应特征的权重。然后应用Lasso回归方法,通过稀疏性约束重新度量各个特征的权重,将部分无关特征的权重收缩至0。最后,将得到的特征权重应用到SVM核函数的计算中,从而避免弱相关或不相关的特征干扰核函数的计算。在9个UCI数据集上分别使用本文算法、经典SVM和一些最新的特征加权SVM算法进行仿真实验,结果表明,HSIC Lasso-FWSVM具有更好的泛化能力和鲁棒性。