全文下载排行

    一年内发表文章 | 两年内 | 三年内 | 全部 | 最近1个月下载排行 | 最近1年下载排行

    当前位置: 一年内发表文章
    Please wait a minute...
    选择: 显示/隐藏图片
    1. 一种针对抖动无人机视频的运动目标检测算法
    刘耀鑫1, 陈仁喜2, 杨伟宏1
    计算机与现代化    2024, 0 (05): 99-103.   DOI: 10.3969/j.issn.1006-2475.2024.05.017
    摘要130)      PDF(pc) (2681KB)(274)    收藏

    摘要:针对悬浮无人机在运动目标检测中易受抖动影响,导致大量背景噪声的问题,提出一种多尺度的EA-KDE背景差分算法(MEA-KDE)。该算法首先对图像序列进行多尺度分解,以获取多尺度的图像序列。然后,在进行检测之前,通过考虑面积阈值和当前图像帧,计算并更新检测的分割阈值,引入当前图像帧信息。其次,对不同尺度的图像帧采用高低双分割阈值进行背景差分运算,以提高检测的鲁棒性。最后,通过对各尺度的检测结果采用一种自顶向下的融合策略进行融合,以在保留目标的清晰轮廓同时消除噪声。此外,提出的一种边界扩展融合后处理算法有助于减轻检测断裂引起的目标破碎现象。实验结果表明,所提算法能够有效抑制抖动导致的背景噪声。在2个真实拍摄的无人机数据集上,分别获得了0.951和0.952的平均F1分数,相较于原算法分别提高了0.144和0.276。


    参考文献 | 相关文章 | 多维度评价 | 评论0
    2. 基于数字孪生的铝电解槽三维可视化监控系统
    张高义1, 徐 杨1, 2, 曹 斌1, 3, 李毅飞3
    计算机与现代化    2024, 0 (05): 104-109.   DOI: 10.3969/j.issn.1006-2475.2024.05.018
    摘要89)      PDF(pc) (3159KB)(269)    收藏

    摘要:传统的铝电解槽管理存在着管理方式单一、透明度低和参数数据呈现形式弱等问题。为了解决这些问题,本文引入数字孪生技术,将其应用到铝电解槽中,基于数字孪生理论模型及框架进行改进,提出数字孪生铝电解槽的三维可视化监控系统六维模型。基于此模型构建电解槽虚拟模型、场景优化、数据采集及数据映射,通过Java后台提供数据接口,使用three.js三维技术结合JavaScript语言对模型以及数据进行渲染,最终设计实现铝电解槽的三维可视化监控系统。该系统为现场人员提供更加直观的展示效果,使其能更好地了解铝电解槽运行状况,为铝行业智能化发展提供有效思路。



    参考文献 | 相关文章 | 多维度评价 | 评论0
    3. 基于改进YOLOv5的复杂路况密集行人检测方法
    孙睿琦1, 窦修超2, 李志华1, 蒋雪梅2, 孙宇豪1
    计算机与现代化    2024, 0 (05): 85-91.   DOI: 10.3969/j.issn.1006-2475.2024.05.015
    摘要110)      PDF(pc) (2884KB)(238)    收藏

    摘要:针对复杂街景环境下行人检测精度低的问题,基于YOLOv5网络,提出一种改进的行人检测网络YOLO-BEN。该网络将残差分级,利用连接模块Res2Net与C3模块进行融合,加强细粒度级别的多尺度特征表示。采用双层路由注意力模块,构建和修剪区域级有向图,在路由区域的联合中应用细粒度的注意力,使网络具备动态的查询感知稀疏性,提高对模糊图像的特征提取能力。改进原网络Neck部分进一步保留局部角区域信息,弥补被遮挡行人的信息丢失问题。使用NWD度量与原有的IoU度量形成联合损失函数,同时增加小目标检测头,提高远距离行人检测效果。实验中该方法在自制数据集和部分WiderPerson数据集上取得了较好的效果,改进后比原始网络的精确率、召回率、平均精度分别提高了2.8、4.3、3.9个百分点。




    参考文献 | 相关文章 | 多维度评价 | 评论0
    4. 老年人跌倒检测技术研究综述
    王梦溪, 李峻
    计算机与现代化    2024, 0 (08): 30-36.   DOI: 10.3969/j.issn.1006-2475.2024.08.006
    摘要378)      PDF(pc) (2530KB)(227)    收藏
    随着我国老龄化程度加剧,空巢独居老人所占比重明显上升,适老化设备越来越受到人们的关注。家庭环境下,由于无人看护、年龄增加以及突发疾病等一系列客观或主观原因导致的老年人跌倒已经成为威胁老年人健康的主要原因之一。因此,实时监测老年人的居家行为,对摔倒行为及时做出检测和预警,在一定程度上可以保障老人的生命安全,降低老年人由于意外跌倒所带来的生命健康风险。本文在对近几年跌倒检测方法研究进行广泛调研的基础上,根据数据获取所使用的不同类型传感器,将跌倒检测技术主要分成2类:非视觉跌倒检测方法和视觉跌倒检测方法。总结介绍了不同跌倒检测方式的系统构成,探讨了国内外最新的相关研究成果,并对其方法特点和实际应用进行了讨论。随着近几年深度学习技术的快速蓬勃发展,本文对基于深度学习的跌倒检测方法进行了重点调研,对相关算法原理及研究成果进行了深入分析与总结。此外,本文还介绍了常用的公开跌倒检测数据集,包括它们的规模和存储格式等特性,最后本文对跌倒检测技术近年来已取得的进展和未来的发展趋势分别进行总结和展望,并提出了不同方面的合理发展建议。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    5. 手势识别与交互综述
    魏嘉焜, 王家润
    计算机与现代化    2024, 0 (08): 67-76.   DOI: 10.3969/j.issn.1006-2475.2024.08.012
    摘要292)      PDF(pc) (1322KB)(201)    收藏
    手势识别与交互技术是人机交互技术与人工智能技术前沿研究的基石任务。该任务以计算机和设备协同工作识别、处理手势信息并给出与手势相对应的机器操作为主要目标,融合应用了动作捕捉、图像处理、图像分类、多端协同交互工作等多项技术,是支撑指挥控制系统、机器人交互、医疗操作等当下前沿智能交互工作与人机交互工作的有力保障。目前,手势识别与交互的相关研究已经日渐成熟,应用领域广泛、应用场景丰富。本文主要对手势识别与交互的相关技术和硬件发展做出综述。首先,全面梳理手势识别与交互技术的研究进展,同时对手势识别的关键步骤进行归类描述;其次,分类阐述用于三维手势交互的当前主流手势识别深度传感器的相关工作;随后,对三维手势识别的真实感识别技术进行剖析和讨论;最后,分析手势识别与交互技术中存在的不足与亟待改进的问题,提出融合深度学习、模式识别等前沿技术与有可行性的研究思路和方法,对该领域未来的研究方向、技术发展和应用领域做出预测和展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    6. 基于图神经网络的多层银企网络融合研究
    李 珊, 王林娜, 高丁佳, 宣海波
    计算机与现代化    2024, 0 (05): 27-32.   DOI: 10.3969/j.issn.1006-2475.2024.05.006
    摘要98)      PDF(pc) (1346KB)(190)    收藏
    摘要:针对金融行业内潜在系统性风险难以精准识别问题,基于直接系统性风险传染渠道的借贷数据以及间接渠道的互联网文本信息,构建多层银企网络,并利用图卷积神经网络(GCN)设计多层银企网络融合模型,根据融合网络量化评估29家银行和75家房地产机构的不同渠道系统性风险传染过程。实验结果表明,在多层金融网络融合任务上,本文融合模型的准确率达到0.8559,优于对比模型。融合网络分析表明,多层网络共同冲击下的银企系统性风险传染能力明显大于单一或者2层网络的系统性风险,且基于间接渠道的企业间网络系统性风险更明显。金融审慎监管应该更多关注文本数据、深度学习等技术对于整合庞大金融资源的能力和有效提高风险监测预警的能力。






    参考文献 | 相关文章 | 多维度评价 | 评论0
    7.    基于LoRA高效微调通用语言大模型的文本立场检测
    韩霄龙, 曾曦, 刘锟, 尚钰
    计算机与现代化    2025, 0 (01): 1-6.   DOI: 10.3969/j.issn.1006-2475.2025.01.001
    摘要232)      PDF(pc) (2429KB)(184)    收藏
    立场检测是自然语言处理中的一个关键任务,它基于文本分析来判断作者的立场。文本立场检测方法从早期的机器学习方法过渡到BERT模型,然后发展到最新的大语言模型,如ChatGPT。由于受限于ChatGPT的闭源特性,本文利用国内开源的ChatGLM3模型,提出一种文本立场检测模型ChatGLM3-LoRA-Stance。为了将大模型有效地应用于专业垂直领域,采用LoRA这一高效的微调方法。与P-Tuning V2相比,LoRA更能适应本文中的零样本和少样本文本立场检测任务。使用公开的VAST数据集对ChatGLM3模型进行微调,评估现有模型在零样本和少样本场景中的性能。实验结果显示,ChatGLM3-LoRA-Stance模型在零样本和少样本检测任务上,F1得分均显著高于其他模型。因此,研究结果凸显了大语言模型在文本立场检测任务上的潜力,并表明使用LoRA高效微调技术能够显著提升ChatGLM3大语言模型在文本立场检测任务中的性能。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    8. 基于代价敏感卷积神经网络的加密流量分类#br# #br#
    钟海龙1, 2, 何月顺1, 何璘琳1, 陈 杰1, 田 鸣3, 郑瑞银4
    计算机与现代化    2024, 0 (05): 55-60.   DOI: 10.3969/j.issn.1006-2475.2024.05.010
    摘要85)      PDF(pc) (1046KB)(173)    收藏
    摘要:针对加密流量分类中由于不平衡数据导致的分类偏差和少数类识别率低的问题,提出一种基于代价敏感卷积神经网络的加密流量分类方法。鉴于传统卷积神经网络在处理不平衡数据时容易偏向多数类,该方法引入动态权重调整策略,使其在每次迭代中根据代价敏感层的反馈来重新评估并自适应调整每个样本的权重。当少数类样本被模型误分类时,其权重会增加,促使模型在后续训练中更加关注它们。随着训练的进行,这种动态权重调整策略持续驱使模型改进并提高对少数类样本的识别能力,从而有效地应对类别不平衡问题。为了避免过拟合,该方法还采纳早停策略,当验证集性能连续下滑时及时终止训练。实验结果表明,本文所提出的网络模型在处理类别不平衡的加密流量分类问题上具有显著的优势,准确率和F1值均达到0.97以上。本文研究为加密流量分类提供了一种更为有效且适应于类别不平衡问题的解决方案,为网络安全领域的研究与应用提供了有益的探索。




    参考文献 | 相关文章 | 多维度评价 | 评论0
    9. 基于注意力机制的U-Net眼底图像分割算法
    张子旭, 李嘉莹, 栾鹏鹏, 彭圆圆
    计算机与现代化    2024, 0 (05): 110-114.   DOI: 10.3969/j.issn.1006-2475.2024.05.019
    摘要82)      PDF(pc) (3307KB)(169)    收藏

    摘要:视网膜眼底血管的半径、宽度等是评估眼部疾病的重要指标,因此精确分割眼底图像具有十分重要的意义。为了有效辅助医生诊断眼部疾病,本文提出一种新的神经网络分割眼底血管图像,基本思想是通过改进传统的U-Net模型,借助一种注意力融合机制,使用Transformer构建通道注意力机制和空间注意力机制,将2个注意力机制获取的信息进行融合,减少信息的丢失。此外,视网膜眼底图像的数量比较少,神经网络的系数比较大,训练时容易发生过拟合,所以引入DropBlock层解决此难题。在公开数据集DRIVE上面进行验证,与多种最新的方法进行对比,本文提出的方法获得最高的ACC值0.967和最高的F1值0.787。实验结果表明,本文提出的方法能够有效地分割眼底图像。



    参考文献 | 相关文章 | 多维度评价 | 评论0
    10. 基于改进YOLOX的输电线路故障检测算法
    吴恒锋, 侯兴松, 王华珂
    计算机与现代化    2024, 0 (05): 5-10.   DOI: 10.3969/j.issn.1006-2475.2024.05.002
    摘要127)      PDF(pc) (2405KB)(164)    收藏
    摘要:电力系统是国民生活的重要基础,对输电线故障进行智能检测具有重大的社会和经济价值。针对输电线故障检测场景缺少公开数据集,同时存在多个尺度目标时检测效果差、高IoU检测框难以获取等问题,本文提出一种基于YOLOX的输电线故障检测算法。本文通过采集和仿真建立输电线故障检测数据集,然后在YOLOX特征融合机制的基础上,提出基于空洞卷积的自适应多尺度特征融合方法,实现多尺度特征的更有效利用,最后提出一种新的损失函数,可以有效提高网络对高IoU检测框的优化能力并解决样本不平衡问题,显著提高检测精度。实验结果表明,在本文的数据集中,本文所提的算法在保证实时性的同时,mAP50:95依然能达到67.48%,超过了EfficientDet、YOLOV5等经典算法。







    参考文献 | 相关文章 | 多维度评价 | 评论0
    11. 基于大模型的设备故障知识图谱自动构建方法
    张昆1, 张永伟1, 吴永城1, 张笑文2, 翟世臣2
    计算机与现代化    2024, 0 (11): 46-53.   DOI: 10.3969/j.issn.1006-2475.2024.11.008
    摘要213)      PDF(pc) (5470KB)(160)    收藏
    故障运维是当前工业生产领域的一个重要研究主题。基于故障知识图谱的故障预测、故障诊断、智能问答等研究都已经得到了较大的发展和应用,然而,高质量的故障知识图谱是这些方法开展的基础。考虑到传统的知识图谱构建技术需要对原始数据进行数据预处理、实体识别、关系抽取以及实体对齐,为了提高知识图谱构建效率,本文的工作聚焦于利用大语言模型(Large Language Model, LLM)对故障运维数据进行无监督知识抽取,设计并实现一种基于大模型的大型故障知识图谱的自动构建方法。该方法主要包含2个部分:1)2种面向故障知识图谱构建的zero-shot Prompt,这些Prompt能够引导大语言模型对故障知识图谱进行概念层的生成和元素层的知识抽取,以RDF语法进行表征和输出; 2)一种基于大语言模型的知识图谱构建方法,该方法可以通过zero-shot Prompt引导大语言模型对故障运维数据进行知识抽取,并以迭代的形式完成大型故障知识图谱的构建。实验结果表明本文提出的方法具有一定的科学性和有效性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    12. 胎盘超声图像分割
    徐 成1, 张 芸2, 曾祥进1
    计算机与现代化    2024, 0 (05): 115-119.   DOI: 10.3969/j.issn.1006-2475.2024.05.020
    摘要66)      PDF(pc) (2234KB)(151)    收藏

    摘要:妊娠早期的胎盘形状和大小与胎儿生长等临床结果紧密相关。针对人工手动标注胎盘轮廓较为耗时的分割方法,设计一种新型深度学习分割网络:DEC-U-Net,该模型设计依据U-Net架构,在U-Net下采样阶段使用深度超参数化卷积代替2D卷积并且联合ECA(Efficient Channel Attention)注意力机制,在不过多引入参数量的同时提高对胎盘细节特征识别的准确度。将交叉注意力机制引入跳跃链接,解决胎盘边界模糊、对比度不均等问题。与普通U-Net网络相比,本文算法分别在交并比(IoU)、召回率(Recall)、精确度(Precision)、Dice系数上提升4.14、9.59、6.2、16.41个百分点。实验结果表明,改进后的网络模型具有较好的分割效果,能够将超声图像中的胎盘进行精确分割。


    参考文献 | 相关文章 | 多维度评价 | 评论0
    13. 基于YOLOv5改进算法的海洋水下垃圾检测方法
    庞 梅, 汪 珙, 詹 泳, 黄哲法
    计算机与现代化    2024, 0 (07): 120-126.   DOI: 10.3969/j.issn.1006-2475.2024.07.018
    摘要163)      PDF(pc) (3845KB)(145)    收藏
    针对水下图像采集存在的光线不足、低分辨率、物体识别不清和小目标较多等局限性导致现有的目标检测算法效果不佳的问题,提出一种基于YOLOv5改进的水下垃圾目标检测算法,以达到更快速更准确地检测和清除海洋水下塑料垃圾的目标。所提算法使用限制对比度自适应直方图均衡化CLAHE预处理方法来增强数据特征,降低特征提取的难度,提高检测精度;引入无参注意力机制SimAM和更换轻量级卷积方法GSConv,在增强网络提取能力的同时减少模型计算量;同时增加多尺度特征融合检测,解决水下垃圾碎屑小目标定位困难的问题。基于自建的真实水下环境垃圾数据集MarineTrash对改进的算法进行充分实验,结果表明,改进的方法具有良好的表现,其中精度提高了4.3个百分点,mAP提高了3.5个百分点,GFLOPs降低了0.3,模型权重仅为13.9 MB,比基线降低了0.6 MB。基于YOLOv5改进的水下垃圾检测算法的研究对于在自主式水下机器人(AUVs)中部署安装探测器,以实现对海洋水下垃圾的检测和自动清除,维护海洋生态系统提供了充分的技术支撑。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    14. 基于DNN与注意力机制的推荐算法模型
    周 超, 丛 鑫, 訾玲玲, 肖谷平
    计算机与现代化    2024, 0 (06): 1-7.   DOI: 10.3969/j.issn.1006-2475.2024.06.001
    摘要129)      PDF(pc) (916KB)(140)    收藏
    摘要:为解决因子分解机在提取高阶组合特征的缺陷问题,更好地学习到更多有用的特征信息,尝试用因子分解机提取交叉特征,并结合注意力网络、深度神经网络和多头自注意力机制等方法,从低、高阶组合特征中学习关键特征信息,最后根据不同阶的组合特征的重要性加权融合得到结果,以预估广告点击率。实验主要基于广告数据集Criteo展开,并在MovieLens数据集上进行类比实验,验证所提出算法模型的有效性,实验结果显示,本文提出的算法模型相较于基准模型,在2个数据集上的AUC指标提升分别有2.32个百分点和0.4个百分点。

     

    参考文献 | 相关文章 | 多维度评价 | 评论0
    15. 基于元路径和注意力机制特征融合的知识概念推荐
    刘雨萌, 訾玲玲, 丛 鑫
    计算机与现代化    2024, 0 (05): 38-45.   DOI: 10.3969/j.issn.1006-2475.2024.05.008
    摘要93)      PDF(pc) (1350KB)(138)    收藏
    摘要:在课程推荐方面的研究领域中绝大多数研究都是针对课程或视频进行推荐,极少有研究关注到对特定知识概念的兴趣或需求。现有的工作主要集中在同构图上,普遍存在用户-项目关系稀疏性的问题。为缓解稀疏性问题,充分利用MOOC数据集拥有的具有多元实体及富含语义信息的上下文关系的特点,本文提出一种结合图卷积神经网路的基于元路径和注意力机制特征融合的知识概念推荐算法(MAFRec)。首先,提取各实体的内容特征和实体间的上下文特征,将其建模为异构信息网络并提取元路径,将元路径对应的邻接矩阵输入到图卷积神经网络中,并在融合了元路径特征向量和用户、概念潜在特征向量的双层网络结构的注意力机制的指导下学习用户和概念实体的表示,最终将用户和概念实体的表示合并到一个扩展的矩阵分解框架中,以预测每个用户的概念兴趣得分。在MOOCCube数据集上的实验结果表明,该算法较BPR、FISM、NAIS、Metapath2vec和MOOCIR算法在命中率、归一化折损累计增益和平均倒数排名指标上均为最优,在一定程度上提高了推荐过程的预测精度和可解释性,并缓解了用户-概念稀疏性的问题。



    参考文献 | 相关文章 | 多维度评价 | 评论0
    16. 基于知识图谱增强大语言模型双碳领域服务
    齐俊1, 2, 曲睿婷2, 教传铭2, 周巧妮2, 郭彦良3, 覃文军3
    计算机与现代化    2024, 0 (09): 8-14.   DOI: 10.3969/j.issn.1006-2475.2024.09.002
    摘要164)      PDF(pc) (1796KB)(138)    收藏
    随着大语言模型的不断发展,其已经在很多领域中得到了广泛的应用。由于大语言模型缺乏双碳领域的知识,直接将大语言模型应用于双碳领域,回复结果准确性偏低。因此,采用构建双碳知识图谱作为知识库的方法,来增强大语言模型在碳达峰碳中和领域中的应用。采用LoRA方法对大语言模型进行微调,提高模型对碳达峰碳中和领域关键词的提取能力,构建双碳知识图谱作为本地知识库为模型提供双碳领域知识,将知识作为问题的上下文,让大语言模型学习,并设计提示工程辅助模型生成回复,最后对回复进行效果评估。实验结果表明,与直接使用大语言模型相比,基于知识图谱增强大语言模型双碳领域服务的方法,在碳达峰碳中和领域的智能化回复结果准确率高,为碳达峰碳中和领域建设提供了有效助力。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    17. 基于意图的轻量级自注意力序列推荐模型
    何思达, 陈平华
    计算机与现代化    2024, 0 (12): 1-9.   DOI: 10.3969/j.issn.1006-2475.2024.12.001
    摘要123)      PDF(pc) (578KB)(135)    收藏
    现有序列推荐模型中自注意力机制计算参数量过大,同时没有充分考虑用户购物意图中的偏好信息。本文提出一种基于意图的轻量级自注意力序列推荐模型。该模型在传统的商品序列编码基础上,引入意图序列编码,进一步挖掘序列间转换模式;同时,为了降低序列中两两商品/意图间自注意力计算复杂度,设计卷积分段采样模块,将用户行为序列和意图序列分为多个片段,即将用户兴趣映射到多个序列片段中,应用自注意力机制捕捉片段间依赖关系,有效减少计算参数量。在MovieLens-1M、Yelp和Amazon-Books这3个公开数据集上进行对比实验,结果表明,相比基线模型,其命中率、归一化折损累计增益和平均倒数排名在MovieLens-1M数据集上提升了5.32%、4.40%和5.51%,在Yelp数据集上提升了30.93%、22.73%和28.84%,在Amazon-Books数据集上提升了7.78%、11.55%和13.98%,充分验证了本文所提模型的有效性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    18. 多尺度特征融合的版面分析方法
    乔 佳, 徐 琨, 胡佩蓉
    计算机与现代化    2024, 0 (05): 16-21.   DOI: 10.3969/j.issn.1006-2475.2024.05.004
    摘要99)      PDF(pc) (7439KB)(135)    收藏
    摘要:针对当前文档版面元素分析中存在的列表和文本错分,表格内小尺度文本难以识别以及空间特征保留效果差等问题,本文基于自底向上的思想,提出一种基于SegNet网络的多特征融合版面分析方法。本文方法在SegNet中引入MSCAN-SE模块,针对表格中的小尺度元素识别率低的问题,利用注意力机制MSCAN-SE中的条状特征来提升模型多尺度特征的提取能力,使得网络能够保留更多尺度的特征信息;针对列表元素和文本元素特征过于相似的问题,通过注意力机制MSCAN-SE中的空洞卷积以及通道注意力分支来扩大网络在特征提取过程的感受野。本文方法与经典的语义分割网络通过实验进行性能比较,结果表明:本文方法在版面分析的测试集上的像素准确率为97.9%,平均交并比为91.7%,平均交并比较U-Net语义分割模型、FCN语义分割模型、DeepLabV3+语义分割模型和SegNet语义分割模型分别提高了7.6%、2.4%、2.6%和1.5%。






    参考文献 | 相关文章 | 多维度评价 | 评论0
    19. 隐性角色下的协同推荐算法
    于天一, 李剑锋, 陈海龙, 翟军
    计算机与现代化    2024, 0 (09): 1-7.   DOI: 10.3969/j.issn.1006-2475.2024.09.001
    摘要130)      PDF(pc) (1594KB)(129)    收藏
    本文以改善算法效果为目标,从用户的心理需求出发,定位用户的隐性角色群体,来对个性化的推荐算法展开研究。从理论的角度来看,本文研究有效保证了推荐系统的多样性要求,并在一定程度上提升了算法的准确性,针对偏好演化现象扩展隐性偏好的相关理论,通过在现实数据中的验证,实验结果显示多项实验评价指标得到显著提升,不仅为推荐系统提供了理论基础和借鉴作用,还能提高推荐结果的准确率,具有广泛的应用前景。从实践的角度来看,本文对用户的分类不再局限于普通的社会属性,能够更深层次地挖掘出用户的心理需求,得到更准确、多样的推荐结果,提高用户的满意度,改善用户体验,而企业则可以引导用户的兴趣变动,提高用户的忠诚度和价值,改善用户生命周期,提高企业利润。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    20. 改进YOLOv5的路侧单目视角小目标检测算法
    魏学诚1, 江凌云1, 李研2, 何非2
    计算机与现代化    2024, 0 (10): 27-34.   DOI: 10.3969/j.issn.1006-2475.2024.10.005
    摘要98)      PDF(pc) (2402KB)(127)    收藏
    针对车路协同感知交通场景下,路侧视角存在远距离目标及小目标识别精度较低、特征较少等问题,提出一种基于YOLOv5的小目标检测改进算法。首先,在主干网络中,加入GAM注意力模块增强网络特征提取能力;其次,引入RepBi-PAN代替原颈部网络的PANet结构增加网络对小目标的定位能力;最后,使用SIoU损失函数代替原来的CIoU损失函数,能够有效地避免预测框在回归过程中的任意匹配,从而增强模型的鲁棒性,加快网络模型的训练速度。实验结果表明相比于原YOLOv5 6.0版本,当交并比IoU为0.5时各类平均精度mAP提升了6.9个百分点,当交并比IoU为0.95时各类平均精度mAP提升了6.4个百分点,有效地提高了路侧视角小目标检测的检测能力。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    21. 基于矩阵恢复的OFDM信道估计方法
    张晶晶, 黄学军
    计算机与现代化    2024, 0 (05): 1-4.   DOI: 10.3969/j.issn.1006-2475.2024.05.001
    摘要111)      PDF(pc) (1380KB)(127)    收藏
    摘要:正交频分复用(Orthogonal Frequency Division Multiplexing, OFDM)中至关重要的一项技术是信道估计,本文提出一种基于矩阵恢复的OFDM信道估计方法,将连续多个OFDM信号的频域信道构造成一个信道矩阵,由于这个信道矩阵是低秩的,所以可以将信道估计问题转换为信道矩阵的加权截断核范数最小化问题,并使用改进的奇异值阈值(Singular Value Thresholding, SVT)算法对信道矩阵进行恢复。仿真结果表明,本文提出的方法和传统信道估计算法相比,使用相同导频数可以获得更高的估计精度,在获得相同估计精度时,消耗导频数更少。与基于压缩感知的信道估计方法相比,本文方法消耗相同数量的导频,但可直接获得高精度的OFDM信道的频域估计。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    22. 基于图像的群体情绪识别综述
    高帅鹏, 王怡凡
    计算机与现代化    2024, 0 (08): 98-107.   DOI: 10.3969/j.issn.1006-2475.2024.08.016
    摘要191)      PDF(pc) (1434KB)(126)    收藏
    近年来,基于图像的群体情绪识别受到了广泛关注,其旨在准确判断不同场景不同数量人群下群体的整体情绪状态。由于群体情绪识别涉及图像中人脸情绪特征、场景特征、人体姿态特征等多种群体情绪线索的分析和融合,使得该领域十分具有挑战性。现阶段该领域缺少相关综述性的文章对现有的研究进行整理,从而更好地进行下一步的研究。本文对该领域内不同情绪线索和不同处理方式的群体情绪识别模型进行细致梳理和分类;同时回顾并分析现有模型的处理方法和特点,整理不同融合方式的模型以及该领域的主流数据库;最后,针对该领域的发展进行简要总结和展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    23. 结合局部自注意力和深度优化的多视图重建
    叶森辉, 王 蕾
    计算机与现代化    2024, 0 (05): 92-98.   DOI: 10.3969/j.issn.1006-2475.2024.05.016
    摘要68)      PDF(pc) (3447KB)(125)    收藏

    摘要:针对多视图三维重建中存在的内存和时间消耗过大、高分辨率重建完整性差等问题,提出一种基于深度学习的多视图重建网络。网络由特征提取模块、级联的Patchmatch模块和深度图优化模块组成。首先,设计U型的特征提取模块,提取多阶段特征图,并在每个阶段引入相对位置编码的局部自注意力层,捕捉图像中的局部细节和全局上下文,提升网络特征提取性能。其次,设计深度残差网络,通过密集连接和残差结构对特征进行融合,充分利用彩色图像先验知识来约束深度图,提升深度估计的准确性。在公开数据集DTU(Technical University of Denmark)上进行测试,实验结果表明,三维重建质量到了有效的提升,与PatchmatchNet相比在完整性上提升了6.1%,在整体性上提升了2.5%,与其他的 SOTA(State-Of-The-Art)方法相比,在完整性和整体性上都得到了较大提升。



    参考文献 | 相关文章 | 多维度评价 | 评论0
    24. 基于模态类别的多模态信息处理与融合综述
    黄文栋, 王怡凡
    计算机与现代化    2024, 0 (07): 47-62.   DOI: 10.3969/j.issn.1006-2475.2024.07.008
    摘要144)      PDF(pc) (1939KB)(125)    收藏
    随着人工智能和深度学习技术的不断发展,多模态信息处理与融合领域的相关研究受到了研究者们的广泛关注。本文总结多模态信息处理的发展历史和里程碑式的工作,以及多模态融合策略和模型。根据模态类别的不同,分类整理多模态信息处理与融合的主流数据集。以模态类型作为分类标准,本文系统地梳理多模态信息处理与融合的研究进展,强调不同模态之间的区别,并将多模态信息处理与融合分为:视听处理与融合、声文处理与融合、视觉-文本处理与融合和视觉-音频-文本处理与融合4种类别,对不同输入模态的处理融合方法与模型进行详细的研究。最后针对多模态处理与融合领域的发展进行总结与展望。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    25. 改进YOLOv5s的落叶树鸟巢检测方法
    程萌, 李浩
    计算机与现代化    2024, 0 (08): 24-29.   DOI: 10.3969/j.issn.1006-2475.2024.08.005
    摘要121)      PDF(pc) (2245KB)(124)    收藏
    针对从落叶树上识别鸟巢具有目标较小、背景复杂、目标与背景易混淆等问题,本文提出一种基于YOLOv5s改进的落叶树鸟巢检测模型YOLOv5s-nest。在Backbone中插入改进的注意力机制Bi-CBAM,提升网络对小目标的感知能力;在Neck中引入SDI结构,以融合更多层次特征图和更高级的语义信息;在Neck中插入InceptionNeXt结构,用于提高模型的性能和运算效率;在Head检测头中将普通卷积替换为PConv,可以更高效地提取空间特征及提高检测效率。实验结果表明,改进模型的平均精确率达到了89.1%,相较于原始模型提高了6.8个百分点。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    26. 基于改进GWO的多无人机三维协同航迹规划
    焦健, 纪元法, 孙希延, 伍建辉, 梁维彬
    计算机与现代化    2024, 0 (10): 1-6.   DOI: 10.3969/j.issn.1006-2475.2024.10.001
    摘要127)      PDF(pc) (2694KB)(124)    收藏
    针对GWO算法求解多无人机协同航迹时存在协同性差、易陷入局部最优、收敛速度慢以及求解精度差的问题,提出一种基于改进GWO的多无人机三维协同航迹规划方法。首先,建立多无人机三维协同航迹规划数学模型,以消耗代价、高度代价、威胁代价、空间约束、时间约束5者的加权和以及惩罚项作为目标函数;其次,利用贪心算法和Tent映射相结合的方法来提高种群适应度,并保留种群的多样性来减小陷入局部最优的可能性;再改进收敛因子来提高算法收敛速度;然后,设计一种动态权重位置更新方法来提高算法的探索和开发能力;最后,将改进的GWO算法应用于多无人机航迹规划问题求解。与GWO算法和CSGWO算法对比的仿真结果表明,所提出的改进GWO算法在求解精度上分别提高了64.8%和16.7%,在收敛速度上分别提升了28.5%和25.4%,并且协同能力明显优于对比算法。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    27. 基于GCN和微调BERT的作文自动评分方法
    马钰, 杨勇, 任鸽, 帕力旦·吐尔逊
    计算机与现代化    2024, 0 (09): 33-37.   DOI: 10.3969/j.issn.1006-2475.2024.09.006
    摘要118)      PDF(pc) (1152KB)(123)    收藏
    作文自动评分是智慧教育领域的重要研究方向之一。它具有提高评分效率、降低人工成本以及确保评分客观性和一致性的优势,因此在教育领域有着广泛的应用前景。尽管句法特征在作文自动评分中扮演着重要角色,但目前仍缺乏关于如何更好地利用这些特征进行作文自动评分的研究。本文提出一种基于GCN和微调BERT的作文自动评分方法GFTB。该模型采用图卷积网络提取作文的句法特征,采用BERT和Adapter的训练方式提取作文的深层语义特征,同时采用门控机制进一步捕捉二者融合后的语义特征。实验结果表明,本文提出的GFTB模型在公共数据集ASAP的8个子集上取得了较好的平均性能,相比于通义千问等基线模型,能够有效提升作文自动评分的性能。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    28. 基于改进XGBoost模型的网络入侵检测研究
    苏凯旋
    计算机与现代化    2024, 0 (06): 109-114.   DOI: 10.3969/j.issn.1006-2475.2024.06.018
    摘要121)      PDF(pc) (472KB)(121)    收藏
    摘要:为了提升传统的网络入侵检测模型的检测准确性和实用性,本文提出一种基于改进梯度提升树(XGBoost)模型的网络入侵检测方法。首先,采用随机森林算法预计关键特征点,在数据的预处理阶段有效地选取了重要性权重最高的特征并构建特征集合;其次,利用卡单方程改进了XGBoost模型的预测方法;最后,在XGBoost优化算法中引入代价敏感函数来提升算法对小样本数据的检测率,应用网格法调参减少模型复杂性。实验结果表明,与其它人工智能算法对比,所提出的模型在具有更高检验精度的情况下降低了50%以上等待时间,并且在噪音环境下具有较强的可扩展性和自适应性,并结合其他模型设置参数消融实验,实验结果表明树深对模型性能影响最大。




    参考文献 | 相关文章 | 多维度评价 | 评论0
    29. 基于改进MobileNetV3-Small的色素减退性皮肤病诊断
    高 埂1, 肖风丽2, 杨 飞1
    计算机与现代化    2024, 0 (05): 120-126.   DOI: 10.3969/j.issn.1006-2475.2024.05.021
    摘要82)      PDF(pc) (1576KB)(117)    收藏

    摘要:传统的色素减退性皮肤病诊断依赖于皮肤科医生主观的临床经验,难以确保每位患者的皮肤病都能被及时精确诊断。因而,亟需一个快速而不依赖于经验的诊断方法。卷积神经网络(Convolutional Neural Network, CNN)具有强大的特征识别能力,为该方法的实现提供了可能。目前基于CNN的诊断方法主要集中在ResNet50等较深的模型,虽然取得了较高的准确率,但是这些模型存在参数量大、识别慢、在移动设备上可用性差的缺点。为此,本文基于MobileNetV3-Small提出一个新的轻量级CNN模型。首先,舍弃MobileNetV3-Small中计算复杂的挤压-激发(Squeeze-and-Excitation, SE)模块,引入较轻量的高效通道注意力(Efficient Channel Attention, ECA)机制;其次,使用计算方便、稳定性好的Leaky-ReLU激活函数;最后,在卷积层中引入空洞卷积,扩大感受野。经过实验测试表明,本文提出的模型相较于现有的诊断模型实现了参数量、识别时间和FLOPs的大幅减少,满足移动应用场景下的高可用性,同时其准确率和F1值仍取得领先性能。最后,基于提出的模型设计出一个移动端的色素减退性皮肤病临床诊断工具。



    参考文献 | 相关文章 | 多维度评价 | 评论0
    30. 字符模糊的中文纸质发票文字识别方法
    来坤
    计算机与现代化    2024, 0 (08): 114-119.   DOI: 10.3969/j.issn.1006-2475.2024.08.018
    摘要99)      PDF(pc) (1686KB)(116)    收藏
    基于纸质发票字符模糊导致OCR识别性能低下的问题,本文提出一种自适应迭代视觉语义模型来解决此问题。该模型包含2个模块:识别模块利用ResNet作为编码器,Transformer为解码器对模糊文本进行初步预测;修正模块将识别模块的预测结果传入双向语义模型,依据上下文语义信息修正字符,进行初步的文本修正,再将结果与标签输入判别器,若判别成功则直接输出结果,若判别失败则会将结果迭代语义模型,进一步修正,提高识别率。实验结果表明,本文所提模型相比目前的中文识别模型ch_PP-OCRv3的识别正确率高出3.39个百分点,与其他模型相比识别率平均提高6.81个百分点,并且在IC15、IIIT5K和IC03-Word等公开数据集中均表现出色,验证了模型的泛化性能。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    31.  基于STAGCN-Informer时空组合模型的风电功率预测方法
    杨绍祖1, 2, 王海程1, 2, 吴金雅1, 2, 马纪颖1, 2
    计算机与现代化    2024, 0 (07): 13-20.   DOI: 10.3969/j.issn.1006-2475.2024.07.003
    摘要139)      PDF(pc) (3491KB)(112)    收藏
    :针对风电功率预测中,空间信息受时空波动性和随机性影响无法有效提取,导致预测精度不足的问题,提出一种基于变分模态分解(Variational Mode Decomposition,VMD)、融合时空注意力图卷积网络(Spatiotemporal Attention Graph Convolutional Network, STAGCN)和改进Informer的组合模型(STAGCN-Informer-DCP)。首先运用VMD对原始特征进行模态分解,提取出不同时间尺度上的特征信息。同时利用北方苍鹰算法(Northern Goshawk Optimization, NGO)优化VMD的核心参数(惩罚因子和K值)选择。其次,利用融合时空注意力的STAGCN模块动态捕捉目标风机与近邻相似风机的时空特征,并将其与原始的信号分量融合获得携带空间尺度信息的特征向量。最后使用改进的Informer模型提取时序上下文的长期依赖关系,并实现多步输出预测。实验结果表明,该组合模型能较好地捕捉动态时空依赖,并有效提高了中长期风电预测的准确度。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    32. 气象服务中台关键技术研究与应用
    冯 冼1, 2, 方 昆1, 屈右铭1, 刘晓波1, 施佳驰1, 文立恒1
    计算机与现代化    2024, 0 (05): 69-74.   DOI: 10.3969/j.issn.1006-2475.2024.05.012
    摘要109)      PDF(pc) (1376KB)(111)    收藏

    摘要:随着气象数据量的不断增长以及应用场景的不断拓展,传统数据处理模式难以满足多行业、融合型服务需求。为解决气象服务数据量大、处理过程复杂、应用需求多样、响应时效要求高等难点,本文开发分布式架构的湖南气象服务中台,并介绍支撑高并发服务的关键技术,包括:采用标准化流程实现多源异构数据统一处理,研发微服务并行处理模块提升数据处理效率,设计动态负载均衡算法增强并发能力,通过流量控制机制保障运行稳定性。测试结果表明:应用上述技术,在有限的基础资源支撑下,湖南气象服务中台可满足5000客户端并发访问需求,平均响应时间为1202 ms,在支撑应急管理、水利水文、自然资源等跨行业、多场景的气象服务中发挥了良好作用。



    参考文献 | 相关文章 | 多维度评价 | 评论0
    33. 基于改进蜉蝣优化算法的机器人磁定位方法
    张源超1, 2, 3, 杨贵志1, 2, 薛 广1, 3, 姚瀚晨3, 彭建伟3, 戴厚德3
    计算机与现代化    2024, 0 (05): 11-15.   DOI: 10.3969/j.issn.1006-2475.2024.05.003
    摘要97)      PDF(pc) (1624KB)(111)    收藏
    摘要:针对现有物流机器人自主导航停车充电方案在远距离时停车定位精度差,造成自动回充模式下移动机器人无法对准充电桩的难题,提出一种基于改进蜉蝣优化算法(MA-LM)的物流机器人停车定位方法。本文方法将多个磁传感器阵列的磁钉定位数据融合,提高物流机器人停车定位的定位精度和定向精度。为了量化评估磁钉定位的提升效果,本文方法使用9个磁传感器组成的传感器阵列和两轮差速移动机器人在充电桩场景测试。相较于遗传优化算法和粒子群优化算法,本文提出的MA-LM算法的定位精度具有优势,在停车定位环节使用MA-LM算法的物流机器人达到定位精度±1.65 mm和定向精度0.9°。




    参考文献 | 相关文章 | 多维度评价 | 评论0
    34. 基于知识图谱和语义信息的学术推荐系统
    张岳, 李华昱, 张智康, 沈鑫怡
    计算机与现代化    2025, 0 (01): 50-58.   DOI: 10.3969/j.issn.1006-2475.2025.01.009
    摘要124)      PDF(pc) (1930KB)(111)    收藏
    在当今互联网的众多应用场景中,面对日益增长的数据量,个性化信息推荐系统的重要性日益凸显。为了提升这些系统的准确性、多样性及可解释性,本文探讨知识图谱的应用潜力。针对现有方法在捕捉用户真实偏好以及忽视语义信息利用价值方面的不足,本文提出一种结合语义特征和知识图谱的先进论文推荐算法。该算法为了突出文本语义在推荐任务中的重要意义,采用BERT模型提取论文摘要中的语义特征,并通过知识图谱的协作传播,有效获取用户和项目的实体表示集合。在表示图谱中的实体时,利用多头注意力机制来区分邻居节点的贡献程度,从而丰富精准传递用户偏好,同时通过注意力聚合网络对不同层级的实体表示集合进行细致区分,且强调初始信息的重要性。在3个公开数据集上的性能评估表明,与当前最优基线模型相比,本文提出的模型在AUC指标上分别提高了0.010、0.018和0.007,在F1指标上分别提高了0.007、0.008和0.008,这一结果充分表明本文算法的有效性和优越性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    35. 基于改进U-Net多特征融合的血管分割#br#
    符灵利, 邱 宇, 张新晨
    计算机与现代化    2024, 0 (06): 76-82.   DOI: 10.3969/j.issn.1006-2475.2024.06.013
    摘要118)      PDF(pc) (1564KB)(110)    收藏

    摘要:由于血管结构分布不均,粗细程度不一致,血管边界对比度较差等一些问题导致图像分割效果不佳,无法满足实际临床辅助的需求。为了解决细小血管在分割时出现断裂,小血管和低对比度血管分割效果差问题,本文在U-Net基础上,首先,在下采样过程中加入CA模块;其次,针对原模型对特征融合不充分的问题,在模型中引入Res2NetBlock模块;最后,在模型底层加入级联空洞卷积模块,来增强模型的感受野,使网络具有更多的空间尺度的信息,且能够加强上下文特征感知能力,使分割任务有着更好的性能。通过在DRIVE、CHASEDB1及自制Dataset100数据集上实验显示,准确率分别为96.90%, 97.83%和94.24%;AUC分别为98.84%,98.98%,97.41%。与U-Net等主流方法进行对比实验表明,灵敏度、准确率等指标均有所提升,表明了本文的血管分割方法具备捕获复杂特征的能力,具有更高的优越性。





    参考文献 | 相关文章 | 多维度评价 | 评论0
    36. 基于循环卷积神经网络的排水管网缺陷检测方法
    刘存莉1, 雷占占2, 郑 澳2
    计算机与现代化    2024, 0 (07): 26-35.   DOI: 10.3969/j.issn.1006-2475.2024.07.005
    摘要108)      PDF(pc) (4477KB)(109)    收藏
    市政排水系统关乎城市道路交通安全,故对其状况进行评估非常重要。在发达国家,闭路电视(CCTV)是下水道评估和维护的主要检测工具,却也为其数据处理带来了新的挑战。本文提出一种基于循环卷积神经网络(RCNN)的排水管网缺陷检测方法。RCNN采用残差网络(ResNet)作为特征提取模块,提取排水管网图像序列的视觉特征,采用双向LSTM学习识别时间特征,以完成排水管网缺陷分类的任务。本文方法将图像序列作为一个整体进行识别。训练集、验证集和测试集共包含8800个图像序列, 211200幅图像。经过RCNN模型的训练和测试,测试集的最高准确率为90.3%。将4种不同融合方式引入本文方法并与基于SVM的方法和基于单帧的方法进行了6组对照实验,同时将基于视觉注意力机制的3种融合方法引入本文方并进行了对照实验,实验结果表明,RCNN取平均值的融合实验精度最高(90.3%),召回率达到了0.977,验证了本文方法在工程应用中的可行性。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    37. 基于语义特征融合的作文自动评分方法
    袁 航, 杨 勇, 任 鸽, 帕力旦·吐尔逊
    计算机与现代化    2024, 0 (06): 8-13.   DOI: 10.3969/j.issn.1006-2475.2024.06.002
    摘要108)      PDF(pc) (623KB)(109)    收藏
    摘要:作文自动评分技术是一种利用机器学习进行自然语言处理的技术。目前,基于深度学习的端到端模型在作文自动评分领域已经广泛使用。然而,由于端到端模型难以获取不同特征之间的相关性,因此提出一种基于语义特征融合的作文自动评分方法(TSEF)。该方法主要分为特征提取和特征融合2个阶段。特征提取阶段,使用Bert模型对输入文本进行预训练,并使用多头注意力机制对输入文本进行自训练,以补充预训练的不足;特征融合阶段,使用交叉融合方法将获取的不同特征融合,以此获得更好性能的模型。在实验中,将TSEF与许多强基线进行比较,结果表明了本文方法的有效性和稳健性。


    参考文献 | 相关文章 | 多维度评价 | 评论0
    38. 基于图像分类的自动绘画心理分析方法
    赵小明, 潘婷, 刘伟锋
    计算机与现代化    2024, 0 (08): 92-97.   DOI: 10.3969/j.issn.1006-2475.2024.08.015
    摘要144)      PDF(pc) (3358KB)(109)    收藏
    绘画心理分析广泛应用于心理问题的发现和精神障碍的治疗中。房树人测试是最具代表性的绘画心理分析方法,通过画者绘制的房屋、树木和人物,投射个体的心理状态。相比于问卷式心理筛查,房树人测试具有非语言性、投射性、创造性等优势,能有效地突破被测者的心理防御。目前,房树人测试是由咨询师实施并进行评定,在大规模的心理筛查中耗时较长,而且评定结果会受到咨询师的经验和主观性的影响。因此,建立一种自动化方法来提高房树人测试的客观性、可靠性和效率是必要的。本文基于心理状态和绘画特征之间的关系提出一种自动的房树人测试绘画筛查方法。本文提取画面的面积、位置、阴影等关键特征,并将这些特征组合构建绘画分类器。该方法可有效地筛查出负向绘画,以便进一步地诊断和治疗。同时本文收集来自高校心理咨询中心的房树人测试绘画并制作房树人数据集以进行实验,实验结果表明了该方法的优越性和应用价值。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    39. 基于知识提示微调的事件抽取方法
    李 璐, 朱 焱
    计算机与现代化    2024, 0 (07): 36-40.   DOI: 10.3969/j.issn.1006-2475.2024.07.006
    摘要118)      PDF(pc) (1020KB)(108)    收藏
    事件抽取是信息抽取中的一个重要研究热点,旨在通过识别和分类事件触发词和论元,从文本中抽取出事件结构化信息。传统的方法依赖于复杂的下游网络,需要足够的训练数据,在数据稀缺的情况下表现不佳。现有研究利用提示学习,在事件抽取上取得一定的研究成果,但依赖手工构建,且只依靠预训练模型已有的知识,缺乏事件特有的知识。因此本文提出一种基于知识提示微调的事件抽取方法。该方法采用条件生成的方式,在现有预训练语言模型知识的基础上,注入事件信息以提供论元关系约束,并采用提示微调策略对提示进行优化。大量实验结果表明,相较于传统基线方法,该方法在触发词抽取上优于基线方法,并在小样本下达到最好的效果。
    参考文献 | 相关文章 | 多维度评价 | 评论0
    40. 基于改进TF-IDF和AGLCNN的新闻长文本分类模型
    周宪溪, 牟莉
    计算机与现代化    2024, 0 (08): 120-126.   DOI: 10.3969/j.issn.1006-2475.2024.08.019
    摘要117)      PDF(pc) (1209KB)(107)    收藏
    新闻长文本分类是自然语言处理中的一项重要任务,但传统的文本表示方法存在特征稀疏、语义不足等问题。此外,新闻长文本含有大量的冗余信息,并且可能涉及其他主题,以上问题都会导致文本特征提取不全面。为此,本文提出一种基于改进TF-IDF算法和AGLCNN的新闻长文本分类模型。该模型首先利用特征项在类间与类内分布情况及其位置信息来改进TF-IDF算法,并结合Word2Vec词向量进行文本表示;利用注意力机制突出关键字信息,输入至Bi-LSTM捕获文本上下文特征;接着利用CNN突出新闻主题的显著特征;考虑到新闻长文本中可能存在涉及其他主题信息的句子,引入门控机制对Bi-LSTM和CNN输出特征进行融合,获得最终的文本特征表示;最后,将特征向量输入Softmax层进行新闻分类。在THUCNews数据集和搜狐新闻数据集上进行对比实验,结果表明,所提模型在2个数据集上的召回率分别为0.985和0.976,优于其他分类模型。
    参考文献 | 相关文章 | 多维度评价 | 评论0