Please wait a minute...

当期目录

    2022年 第0卷 第08期    刊出日期:2022-08-22
    中文信息处理技术
    混合CTC/Attention模型在普通话识别中的应用
    许鸿奎, 张子枫, 卢江坤, 周俊杰, 胡文烨, 姜彤彤
    2022, 0(08):  1-6. 
    摘要 ( 269 )   PDF (1151KB) ( 85 )  
    参考文献 | 相关文章 | 计量指标
    基于链接时序分类(Connectionist Temporal Classification, CTC)的端到端语音识别模型具有结构简单且能自动对齐的优点,但识别准确率有待进一步提高。本文引入注意力机制(Attention)构成混合CTC/Attention端到端模型,采用多任务学习方式,充分发挥CTC的对齐优势和Attention机制的上下文建模优势。实验结果表明,当选取80维FBank特征和3维pitch特征作为声学特征,选择VGG-双向长短时记忆网络(VGG-Bidirectional long short-time memory, VGG-BiLSTM)作为编码器应用于中文普通话识别时,该模型与基于CTC的端到端模型相比,字错误率下降约6.1%,外接语言模型后,字错误率进一步下降0.3%;与传统基线模型相比,字错误率也有大幅度下降。
    基于Attention-BIGRU-CRF的中文分词模型
    周慧, 徐名海, 许晓东
    2022, 0(08):  7-12. 
    摘要 ( 231 )   PDF (1062KB) ( 75 )  
    参考文献 | 相关文章 | 计量指标
    自然语言处理是人工智能发展的重要分支,而中文分词是自然语言处理的第一步,提高中文分词的效率可以提高自然语言处理的结果的准确性。因此提出一种Attention-BIGRU-CRF模型,首先将中文文本通过词向量转换,将文本转换成向量的形式,再利用BIGRU进行序列化学习,随后引入attention机制将BIGRU的输入和输出进行相关性计算获取更精确向量值,最后将该向量值与BIGRU序列化得到的向量值进行拼接作为CRF层的输入并得到标签预测结果。由仿真结果可知,Attention-BIGRU-CRF模型在人民日报2014和MSRA的语料库得到的F1值分别为97.34%和98.25%,处理文本的分词速率为248.1 KB/s。故融合attention机制和BIGRU-CRF网络的模型既能够提高分词准确率,又能提高分词时间和效率。
    算法设计与分析
    改进二进制和声搜索算法求解多维背包问题
    刘雅文, 蒋妍, 潘大志
    2022, 0(08):  13-19. 
    摘要 ( 149 )   PDF (1602KB) ( 71 )  
    参考文献 | 相关文章 | 计量指标
    和声搜索(HS)是一种已广泛应用于连续优化问题的元启发式方法。针对典型的组合优化问题——多维背包问题(MKP),提出一种改进二进制和声搜索(IBHS)算法。算法通过伯努利随机过程生成二进制群体,在候选和声生成算子中,引入动态自适应参数,通过算法参数的自适应调整来协调算法的全局搜索和局部搜索,并提出一种新的更有效的衡量商品多维加权价值密度的方法用于二进制个体修正和优化;引入精英局部搜索机制进行协同寻优,提高IBHS的收敛速度。通过求解10组不同规模的典型多维背包算例和与贪心二进制狮群优化(GBLSO)算法、改进的差分演化(MBDE)算法以及二进制修正和声(BMHS)算法的对比分析,实验结果表明,所提算法在求解MKP时有具有良好的收敛效率、较高的寻优精度和很好的鲁棒性。
    基于改进Dijkstra算法的防冲突最短路径规划研究
    黄翼虎, 于亚楠
    2022, 0(08):  20-24. 
    摘要 ( 246 )   PDF (781KB) ( 100 )  
    参考文献 | 相关文章 | 计量指标
    多无人机在执行作业任务时可能面临发生航迹冲突的矛盾,由此提出一种改进Dijkstra算法用来实现多无人机寻找最短且互不冲突航线的功能。在经典Dijkstra算法搜寻并对各航迹节点遍历运算的过程中,通过引入各节点的前驱节点变长回溯数组来记录各节点包含的所有前驱节点,找出各任务从起始点到达目标点所存在的全部可行的最短长度航线。再引入时间窗冲突判断模型从各任务的所有可行航线中将互不冲突的航线分离出来,一旦所有航线都冲突,则将其中一条最短航线中的冲突节点当作临时障碍点处理,通过改变回溯数组重新找出与其他任务互不冲突的一条最短航线。应用Matlab软件设计编写程序来进行算法验证,实验表明该改进算法在多无人机执行作业任务时可以规划出各任务包含的全部长度最短且互不冲突的航线,任务集合的规划效率有了明显提高。
    基于FLANN改进的KNN医疗分类算法
    郭凯, 艾菊梅
    2022, 0(08):  25-29. 
    摘要 ( 154 )   PDF (1025KB) ( 66 )  
    参考文献 | 相关文章 | 计量指标
    本文通过研究KNN(K-最近邻)算法在疾病预测领域的使用与分析,总结出KNN的2点不足,针对不足进行相应改进并提出F_KNN(循环最近邻搜索)算法:1)针对KNN计算量大、效率低下的缺点,本文采用FLANN(快速最近邻搜索)循环搜索与待测样本距离最近的点,记录若干个最近邻点作为最近邻点子集,利用此子集取代全集对待测样本进行计算,可以降低计算量,极大地提高了KNN算法效率;2)针对KNN难以对高维数据集分类的缺点,本文采用AHP(层次分析法)对样本的特征属性进行相关性研究,使用合适的参数分配权重,提高了KNN算法准确率。本文采用一组脑中风数据集对优化后的算法进行实验,实验结果表明,F_KNN准确率达96.2%。与传统KNN相比,F_KNN提高了分类性能且极大地提高了算法效率。在处理高维且较大的数据集时,F_KNN算法优势明显,具有较好的应用前景。
    基于梯度差的声速剖面自适应分层算法
    马茜, 段毅, 徐冬,
    2022, 0(08):  30-35. 
    摘要 ( 123 )   PDF (1169KB) ( 63 )  
    参考文献 | 相关文章 | 计量指标
    声速剖面表示声速与深度的函数关系,常用于水声定位,以纵轴表示海深,横轴表示声速。针对高精度水声定位系统中定位精度与计算量相互矛盾的问题,提出一种声速剖面自适应分层算法。该算法根据声速在有限范围内规律变化的特点,对声速剖面逐层搜索。通过声速层之间声速变化梯度差情况找出声速变化的节点,保留原始声速剖面特征,实现对声速剖面的简化。仿真实验结果表明,根据阈值选取的大小,算法自适应分层处理后对原声速剖面的精简可达70%。在选取合适阈值时,与D-P算法相比可以获得更小的定位误差,具有良好的工程应用价值。
    融合节点中心性和度相关聚类的有向网络链路预测
    陈广福, 连雁平,
    2022, 0(08):  36-42. 
    摘要 ( 138 )   PDF (1293KB) ( 64 )  
    参考文献 | 相关文章 | 计量指标
    现存大部分有向网络的链路预测方法仅关注链接方向信息和互惠链接信息而忽略节点重要性及度相关聚类的贡献,导致预测精度下降。针对以上不足,提出基于节点中心性和度相关聚类的有向网络链路预测指标。首先,利用节点中心性统计任意节点邻居数量去衡量节点的影响力;其次,将节点度相关聚类系数方法扩展到有向网络去评估节点聚类能力,并与网络同配系数相融合获得节点对高聚类能力;最后,融合以上2类信息提出一个带参的有向网络链路预测指标。在6个真实世界有向网络上与最近代表性预测指标比较,所提指标AUPR和AUC分别提高了33%和1.6%。
    人工智能
    基于组稀疏联合学习的影像遗传学数据关联分析
    赵迎利, 朱旭
    2022, 0(08):  43-49. 
    摘要 ( 118 )   PDF (2274KB) ( 60 )  
    参考文献 | 相关文章 | 计量指标
    影像遗传学的发展很大程度上促进精神类疾病的研究,其主要是分析并挖掘多模态数据以找出与疾病相关的致病机制,但是此类数据的特征之间通常呈现出群组相关或者多个特征相关的特性,传统的方法很难找出具有相关性的疾病机制,易出现过稀疏的问题。针对上述问题,本文引入可以实现组内稀疏和组间平滑的正则化项l1,2范数,并将其与可以实现组间稀疏和组内平滑的l2,1范数联合共同惩罚典型相关分析,通过优化数据之间的相关性实现具有相关性的群组特征和组内特征之间的两模态数据集的特征选择。仿真实验结果表明,本文方法在较准确地估计出2组数据之间的相关系数的同时可选择出具有相关性的组间特征和组内特征;在真实的精神分裂症数据集上,本文方法可找出更多的与精神分裂症相关的易感基因和风险脑区。
    基于语义融合和多重相似性学习的跨模态检索
    曾奕斌, 葛红
    2022, 0(08):  50-56. 
    摘要 ( 169 )   PDF (932KB) ( 68 )  
    参考文献 | 相关文章 | 计量指标
    针对现有跨模态检索方法不能充分挖掘模态之间的相似性信息的问题,提出一种基于语义融合和多重相似性学习(CFMSL)方法。首先,在特征提取过程中融合不同模态的语义信息,加强不同模态特征间的交互,使得模型能够充分挖掘模态间的关联信息。然后,利用生成器将单模态特征和融合模态特征映射到公共子空间中,通过最大化锚点与正例样本之间的相似性和最小化锚点与负例样本间的相似性得到具有判别性的特征进行模态对齐。最后,基于决策融合方式对相似性列表进行重排序,使得最终排序结果同时考虑单模态特征和融合模态特征,提高检索性能。通过在Pascal Sentences、Wikipedia、NUS-WIDE-10K这3个广泛使用的图文数据集上进行实验,实验结果表明CFMSL模型能够有效提高跨模态检索任务的性能。
    数据库与数据挖掘
    结合动态多类信息的兴趣点推荐
    冯申, 於跃成, 张宗海
    2022, 0(08):  57-64. 
    摘要 ( 111 )   PDF (1079KB) ( 70 )  
    参考文献 | 相关文章 | 计量指标
    利用用户的历史签到数据的同时考虑用户的长期偏好和短期偏好已成为当今兴趣点(Point-of-Interest, POI)推荐的主流方法之一。然而,现有方法往往忽略了用户评论中隐含的用户偏好信息,忽视了不同用户在对长期偏好和短期偏好的依赖上所存在的差异性。针对上述局限,本文提出一种结合动态多类信息的兴趣点推荐方法DMGCR。首先,利用注意力机制捕获用户对不同兴趣点的关注程度,定量刻画用户对兴趣点的长期偏好。其次,将评论信息与已有的位置和类别信息相结合,并利用双向长短期记忆网络学习评论文本中隐含的语义特征,在捕获用户对兴趣点情感倾向的基础上准确刻画用户的短期偏好。最后,设计融合动态多类信息的用户偏好综合预测函数,实现下一个兴趣点推荐概率的定量计算。多个数据集上的实验结果验证了该方法在推荐性能上的有效性和优越性。
    基于聚类分析的航班油耗组合估计
    李舒, 张伟业, 汪坤, 段照斌
    2022, 0(08):  65-69. 
    摘要 ( 115 )   PDF (1865KB) ( 61 )  
    参考文献 | 相关文章 | 计量指标
    针对碳排放报告中燃油消耗数据存在单个不连续缺失和连续缺失2类数据,使用单一方法估计误差大的问题,提出一种基于聚类分析的组合估计方法。该方法首先采用K-medoids聚类算法将数据归类为单个不连续缺失数据以及连续缺失数据,然后使用NB方法对单个不连续数据进行估计填充,使用DTW方法对连续缺失数据估计填充,最后分别在1%、2%以及3%均方根误差时进行估计结果评价。实验结果表明:基于聚类分析的NB-DTW组合方法能有效降低估计误差,在1%、2%以及3%均方根误差时比NB方法分别降低了9.3%、12.1%、12.96%,比DTW方法分别降低了35.46%、43.62%、55.04%。
    计算机仿真
    考虑后视和多前车信息反馈的车辆跟驰模型
    惠飞, 席辉, 张凯望, 魏思
    2022, 0(08):  70-77. 
    摘要 ( 169 )   PDF (1795KB) ( 66 )  
    参考文献 | 相关文章 | 计量指标
    为改进车联网环境下车辆跟驰模型的稳定性,在经典OVCM模型基础上考虑后视效应、多前车速度差和多前车最优速度记忆综合信息对交通流稳定性能的影响,提出一种基于后视和多前车信息反馈的扩展车辆跟驰模型。根据线性稳定性分析法得出模型的中性稳定性判断条件,并进行数值仿真实验与分析。实验结果表明,在扰动初始条件设置一致下,所提模型相比于OV、FVD、OVCM模型,交通流稳定区域增大,速度波动幅度减小,特别是考虑的前车数k、后视敏感系数λi和记忆效应敏感系数γi取值为k=3,λi=[0.2,0.15,0.1],γi=[0.1,0.08,0.06]时,车辆的平均速度波动率低于0.1%,由此说明,所提模型能有效减少扰动影响,增强交通流的稳态保持。
    一种改进的求解柔性作业车间调度问题的灰狼算法
    田云娜, 田园, 刘雪, 赵彦霖
    2022, 0(08):  78-85. 
    摘要 ( 166 )   PDF (1216KB) ( 63 )  
    参考文献 | 相关文章 | 计量指标
    柔性作业车间调度问题是智能制造领域的一类典型调度问题,它是制造流程规划和管理中最关键的环节之一,有效的求解方法对提高生产效率具有重要的现实意义。本文基于经典灰狼算法进行改进,以优化最大完工时间为目标,提出一种改进的灰狼算法来求解柔性作业车间调度问题。算法首先采用基于权值的编码形式,实现对经典狼群算法中连续性编码的离散化;其次在迭代优化过程中加入随机游走策略,以增强局部搜索能力;然后在种群更新过程中加入尾部淘汰策略,在避免局部优化的同时增加种群多样性,合理扩大算法的广度搜索范围。在标准算例上的仿真实验结果表明,改进的灰狼算法在求解FJSP时比经典灰狼算法在寻优能力方面具有明显的优势,相比其它智能优化算法,本文所提算法在每种算例上均具有更好的优化性能。
    基于能耗与延迟优化的移动边缘计算任务卸载模型及算法
    战俊伟, 庄毅
    2022, 0(08):  86-93. 
    摘要 ( 239 )   PDF (1302KB) ( 65 )  
    参考文献 | 相关文章 | 计量指标
    随着移动边缘计算的兴起,如何处理边缘计算任务卸载成为研究热点问题之一。针对多任务-多边缘服务器的场景,本文首先提出一种基于能量延迟优化的移动边缘计算任务卸载模型,该模型考虑边缘设备的剩余电量,使用时延、能耗加权因子计算边缘设备的总开销,具有延长设备使用时间、减少任务卸载时延和能耗的优点。进一步提出一种基于改进遗传算法的移动边缘计算任务卸载算法,将求解最优卸载决策的问题转化为求解种群最优解的问题。对比仿真实验结果表明,本文提出的任务卸载模型和算法能够有效求解任务卸载问题,改进后的任务卸载算法求解更精确,能够避免局部最优解,利于寻找最优任务卸载决策。
    信息安全
    基于国产TCM芯片加密的边云协同数据采集架构
    刘强, 李巧, 鲍晓
    2022, 0(08):  94-98. 
    摘要 ( 138 )   PDF (1041KB) ( 71 )  
    参考文献 | 相关文章 | 计量指标
    审计部门在对内部各单位进行审计工作前,需要对各类材料进行搜集整理作为审计依据,包括互联网公开数据和单位内部涉密数据。在搜集单位内部涉密数据时通常需要加密介质传输或审计人员直接到现场进行工作。本文提出一种以国产TCM芯片加密,边云协同为基础的采集架构。该架构能够同时采集互联网公开数据和单位内部涉密数据,通过固化于硬件内部的TCM芯片进行加密,保证只有指定机器能够阅览涉密材料。基于国产TCM芯片加密的审计数据边云协同采集架构能够实现涉密数据的跨网络传输。据审计用户使用反馈,以涉密数据使用加密介质传输为对比场景,在采用协同采集架构后能够实现在本地快速进入审计工作,数据获取效率平均提升30%,非异地审计工作时间减少3天~4天,有效提升了审计工作效率。
    基于混合N-Gram模型和XGBoost算法的内部威胁检测方法
    孙丹, 饶兰香, 施炜利, 孟莎莎, 胡少文, 胡必伟, 应嵩
    2022, 0(08):  99-105. 
    摘要 ( 167 )   PDF (1019KB) ( 62 )  
    参考文献 | 相关文章 | 计量指标
    随着政府企事业单位网络安全机制的建立健全,单纯从外部进入目标系统的攻击门槛越来越高,导致内部威胁逐渐增多。内部威胁区别于外部威胁,攻击者主要来自于内部用户,使得攻击更具隐蔽性,更难被检测。本文提出一种基于混合N-Gram模型和XGBoost算法的内部威胁检测方法。采用词袋、N-Gram、词汇表3种特征提取方法进行实验比对及参数N值筛选,基于混合N-Gram模型和XGBoost算法的内部威胁检测方法检测效果比通过1维数据、2维数据、4维数据的不同特征进行组合的特征子集效果更优,特定度达到0.23,灵敏度达到27.65,准确度达到0.94,F1值达到0.97。对比特定度、灵敏度、准确度、F1值4项评价指标,基于混合N-gram特征提取方法比传统的词袋、词汇表特征提取方法在检测中更有效。此检测方法不仅提高了内部威胁检测特征码的区分度,同时提高了特征提取的准确性和计算性能。
    图像处理
    基于四叉树分解和自适应焦点测度的多聚焦图像融合
    王纪委, 曲怀敬, 魏亚南, 谢明, 徐佳, 张志升, 张汉元
    2022, 0(08):  106-113. 
    摘要 ( 174 )   PDF (8545KB) ( 64 )  
    参考文献 | 相关文章 | 计量指标
    为了克服基于块的融合方法对块的大小敏感以及融合图像中存在伪影等问题,提出一种新的基于四叉树分解和自适应焦点测度的多聚焦图像融合方法。首先,设计一种新的基于修正拉普拉斯能量和(SML)和导向滤波的自适应焦点测度,用于获得源图像的焦点图。然后,采用一种新的四叉树分解策略,并结合已经得到的焦点图,进一步将源图像分解成最优大小的树块;同时,从树块中检测出聚焦区域,并构成决策图。最后,对决策图进行优化和一致性验证,并重构出一幅全聚焦图像。通过公共多聚焦图像数据集进行实验,与11种先进的融合方法进行视觉质量和客观指标比较。实验结果表明,本文所提出的融合方法取得了更好的性能。
    基于卷积自编码器的医用玻璃瓶口缺陷检测方法
    任秋霖, 任德均, 李鑫, 闫宗一, 曹林杰, 唐洪
    2022, 0(08):  114-120. 
    摘要 ( 178 )   PDF (2962KB) ( 69 )  
    参考文献 | 相关文章 | 计量指标
    为解决缺陷检测中缺陷样本数量少、种类多、难以提供足够的数据来进行有监督深度学习模型训练的问题,本文利用工业生产中大量易获取没有缺陷的正样本数据,建立Encoder-Decoder结构的卷积自编码网络缺陷检测模型,将空间和通道注意力的卷积注意力模块嵌入编码器中增强网络特征提取能力。在编码阶段加入上下文信息模块,获得更大的感受野,减小计算量。同时,结合多尺度结构相似性MS-SSIM和L1损失来改善图像重构效果,使用峰值信噪比PSNR衡量重构误差并判别异常。实验结果表明,提出的医用玻璃瓶口缺陷检测方法能够准确检出缺陷数据和分割缺陷区域,精确度为99.45%、召回率为97.63%、漏检率为0.55%、误检率为2.93%。该方法能够准确检出玻璃瓶口缺陷,定位缺陷区域,同时图像重构耗时短,仅需10.37 ms左右,能够实现准确、高效的自动化产品质量检测。
    基于多级Transformer的超大倍率重建网络:参考图像超分辨率
    陈彤, 周登文
    2022, 0(08):  121-126. 
    摘要 ( 264 )   PDF (2750KB) ( 58 )  
    参考文献 | 相关文章 | 计量指标
    超分辨率(SR)是指从一个低分辨率图像,重建其对应的高分辨率副本。针对SR在超大倍率(8×、16×)重建不够精确的问题,本文提出多级Transformer的超大倍率重建网络(MTLF)。MTLF对多个Transformer进行多级堆叠以处理不同倍率的特征,并且利用修正注意力模块改进由Transformer得到的注意力权重,从而合成更精细的纹理。最后将所有倍率的特征融合成超大尺度下的SR图像。实验结果表明MTLF优于目前最好的方法(包括单图像超分辨率和基于Ref的超分辨率方法)。特别地,MTLF在极限倍率(32×)下也取得不错的效果。