Please wait a minute...

当期目录

    2021年 第0卷 第07期    刊出日期:2021-08-02
    算法设计与分析
    继电保护信息系统终端设备智能测试系统
    巫聪云, 刘斌, 李海勇, 徐晓峰
    2021, 0(07):  1-5. 
    摘要 ( 172 )   PDF (926KB) ( 129 )  
    参考文献 | 相关文章 | 计量指标
    为了达到快速、精准的继电保护信息系统终端设备测试效果,设计一种继电保护信息系统终端设备智能测试系统。利用无线方式将数据采集模块所采集的终端设备数据传输至数据处理模块;利用信号处理算法除掉原始数据中的干扰数据,使其符合监测预警模块的要求;实现终端设备运行状态量变化实时监测,并发出预警等级信息;智能测试模块将高于监测预警指标的终端设备数据形成录波数据,利用保护装置结合录波数据获取保护运作行为结果,通过评价运作行为结果完成终端设备智能测试。实验结果表明,所研究的系统能够实现继电保护信息系统终端设备的智能化测试,提升测试终端设备的工作效率与电力企业的经济效益。
    网约拼车出行的乘客车辆匹配及路径优化
    陈玲娟, 寇思佳, 柳祖鹏
    2021, 0(07):  6-11. 
    摘要 ( 426 )   PDF (1353KB) ( 135 )  
    参考文献 | 相关文章 | 计量指标
    城市道路拥堵严重及共享理念的盛行带来了拼车出行的兴起。出行线路相似的乘客共乘一辆车,可提高座位利用率、节省费用、缓解交通压力。以带时间窗约束的无换乘多车辆静态拼车问题为研究背景,从车辆使用费、途中走行成本及到达时间窗惩罚成本3个方面建立乘客车辆匹配及路径优化的目标函数,以车辆容量、乘客出发及到达时间窗、路径无迂回、乘客车辆匹配无重叠等限制构建模型约束条件,采用演化策略算法求解问题,根据模型特征设计编码解码规则,解码结果可同时获得车辆乘客匹配关系和走行路径,采用交叉变异操作更新迭代个体种群,进而求得最优解。运用MATLAB求解算例验证了模型可行性及算法有效性,结果表明算法能快速响应静态拼车问题,在较短时间即可给出乘客车辆的先后匹配关系及车辆走行路径,拼车方案相比独自出行能节省更多成本。
    基于资源分配与图嵌入加权的链路预测算法
    万杨晔, 郭进利
    2021, 0(07):  12-17. 
    摘要 ( 138 )   PDF (1198KB) ( 90 )  
    参考文献 | 相关文章 | 计量指标
    融入权重信息的加权链路预测算法大都具有更好的预测效果,现有的大多数加权算法都是基于外部权重信息,基于网络拓扑结构权重的研究较少。针对此问题,提出一种利用无权网络的结构特征生成结构权重的加权链路预测算法。首先计算资源分配指标得到网络局部结构相似性,再利用DeepWalk算法学习网络结构特征生成节点向量得到余弦相似性,将2个相似性结合定义出网络的结构权重。最后在4个数据集上进行实验,将融入权重信息的3种不同类型相似性指标W-CN、W-LP、W-RWR与对应的无权指标进行对比。结果表明,融入结构权重信息的预测算法具有更高的预测精度。
    基于主动学习的命名实体识别算法
    张岑芳
    2021, 0(07):  18-22. 
    摘要 ( 225 )   PDF (715KB) ( 90 )  
    参考文献 | 相关文章 | 计量指标
    命名实体识别的目的是识别文本中的实体指称的边界和类别。在进行命名实体识别模型训练的过程中,通常需要大量的标注样本。本文通过实现有效的选择算法,从大量样本中选择适合模型更新的样本,减少对样本的标注工作。通过5组对比实验,验证使用有效的选择算法能够获得更好的样本集,实现具有针对性的标注样本。通过设计在微博网络数据集上的实验,验证本文提出的基于流的主动学习算法可以针对大量互联网文本数据选择出更合适的样本集,能够有效减少人工标注的成本。本文通过2个模型分别实现实体的边界提取和类别区分。序列标注模型提取出实体在序列中的位置,实体分类模型实现对标注结果的分类,并利用主动学习的方法实现在无标注数据集上的训练。使用本文的训练方法在2个数据集上进行实验。在Weibo数据集上的实验展示算法能从无标签数据集中学习到文本特征。在MSRA数据集上的实验结果显示,在预训练数据集的比例达到40%以上时,模型在测试数据集上的F1值稳定在90%左右,与使用全部数据集的结果接近,说明模型在无标签数据集上具有一定的特征提取能力。
    基于用户信息向量聚类和改进SAMME的推荐算法
    王杉文, 欧鸥, 马万民, 陈建林
    2021, 0(07):  23-28. 
    摘要 ( 181 )   PDF (1294KB) ( 88 )  
    参考文献 | 相关文章 | 计量指标
    针对目前主流的推荐算法中获取的用户信息不完整以及推荐时间过长的问题,本文提出一种基于用户信息向量聚类和改进SAMME的推荐算法,该算法通过分析用户基本信息(地域、时间、兴趣、标签等),找出用户信息关键词;对不同用户信息关键词基于TF-IDF方法进行加权构建用户信息向量;接着使用K-means算法进行用户聚类分析,将用户聚类结果作为改进SAMME训练样本集;最后通过改进SAMME算法将预测结果对用户进行好友推荐,并在训练过程中保存模型,大大减少推荐时间。最终将本文算法在真实的微博用户数据集上进行实验,并与其他主流算法进行对比,结果显示本文算法在准确率、召回率、F值上都取得了不错的效果。
    基于深度学习的文本分类综述
    贾澎涛, 孙炜
    2021, 0(07):  29-37. 
    摘要 ( 585 )   PDF (1071KB) ( 264 )  
    参考文献 | 相关文章 | 计量指标
    随着互联网的不断发展,网络上的文本数据日益增多,如果能对这些数据进行有效分类,那么更有利于从中挖掘出有价值的信息,因此文本数据的管理和整合显得十分重要。文本分类是自然语言处理任务中的一项基础性工作,主要应用于舆情检测及新闻文本分类等领域,目的是对文本资源进行整理和归类。基于深度学习的文本分类,在对文本数据处理中,表现出较好的分类效果。本文对用于文本分类的深度学习算法进行详细阐述,按照深度学习的不同算法进行分类,并分析各种算法的特点,最后对深度学习算法在文本分类领域的未来研究方向进行总结。
    基于ELMO的低资源神经机器翻译
    王浩畅, 孙孟冉, 赵铁军
    2021, 0(07):  38-42. 
    摘要 ( 199 )   PDF (601KB) ( 70 )  
    参考文献 | 相关文章 | 计量指标
    低资源神经机器翻译的研究难点是缺乏大量的平行语料来给模型进行训练。随着预训练模型的发展,并且在各大自然语言处理任务中均取得很大的提升,本文提出一种融合ELMO预训练模型的神经机器翻译模型来解决低资源神经机器翻译问题。本文模型在土耳其语-英语低资源翻译任务上相比于反向翻译提升超过0.7个BLEU,在罗马尼亚语-英语翻译任务上提升超过0.8个BLEU。此外,在模拟的中-英、法-英、德-英、西-英这4组低资源翻译任务上相比于传统神经机器翻译模型分别提升2.3、3.2、2.6、3.2个BLEU。实验表明使用融合ELMO的模型来解决低资源神经机器翻译问题是有效的。
    数据库与数据挖掘
    移动群智感知中图片情境信息的聚类动态查找算法
    蔡丽萍, 张晨晨, 李世宝, 刘建航
    2021, 0(07):  43-48. 
    摘要 ( 141 )   PDF (1012KB) ( 69 )  
    参考文献 | 相关文章 | 计量指标
    使用移动设备摄像头进行感知是移动群智感知主要形式之一,预先利用照片的情境信息聚类可以减少图片特征相似计算,提高照片冗余判断效率。为了提高情境信息聚类精度,本文提出一种聚类动态查找算法,解决动态聚类近边缘相似的问题。首先,根据PTree聚类算法是否聚类到已有区间分为实枝叶和虚枝叶,实枝叶的数据直接上传,虚枝叶进一步动态查找最佳相似匹配区间;然后,基于使用局部扩大再动态缩小的思想,减少动态聚类数据点之间平均距离;最后,聚类到同一区间的图片集进行相似过滤。通过设计的APP收集带有情境信息的照片数据,结果表明,与现有方案相比,在保证覆盖度的前提下有效减少所需上传照片数量,提高去冗余效果。
    基于改进eRCNN的局部路网交通流预测
    姚思佳, 桂智明, 郭黎敏
    2021, 0(07):  49-53. 
    摘要 ( 157 )   PDF (1047KB) ( 77 )  
    参考文献 | 相关文章 | 计量指标
    针对误差反馈循环卷积神经网络在运用到短时交通流预测时存在仅仅能接收时序误差序列,忽略交通流误差数据中隐含的空间拓扑特征,且在模型初始化时其采用的通用卷积神经网络初始化方法降低了模型训练效率的问题,本文提出一种优化的误差反馈循环卷积神经网络模型,在误差反馈循环卷积神经网络模型基础上根据预测误差数据的时空特性对误差反馈层进行结构强化,能够处理包含简单空间关系的误差序列。同时通过在模型训练的过程中分离模型产生的历史预测误差和训练误差,使得模型构建过程更加高效,加速了模型收敛速度。通过北京市四环道路交通数据的实验表明,优化的误差反馈循环卷积神经网络预测模型在预测精度、构建效率及鲁棒性上均得到有效提高。
    基于动态双子种群的差分进化K中心点聚类算法
    邓斌涛, 徐胜超
    2021, 0(07):  54-59. 
    摘要 ( 149 )   PDF (848KB) ( 67 )  
    参考文献 | 相关文章 | 计量指标
    随着海量大数据的出现,聚类算法需要新型计算模式来提高计算速度与运行效率。本文提出一种基于动态双子种群的差分进化K中心点聚类算法DGP-DE-K-mediods(Dynamic Gemini Population based DE-K-mediods)。DGP-DE-K-mediods利用动态双子种群方法,解决聚类算法在维持种群密度的时候避免陷入局部最优的问题;采用差分进化(Differential Evolution, DE)算法来提高全局最优能力的强健性;基于Hadoop云平台来并行处理DGP-DE-K-mediods,加快算法的运行速度和效率;描述基于MapReduce的并行聚类算法的编程过程;DGP-DE-K-mediods利用UIC的大数据分类的案例数据和网络入侵检测这种大数据应用来仿真算法的效果。实验结果表明,与已有的聚类算法相比,DGP-DE-K-mediods在检测精度、运行时间上有明显的优势。
    基于大数据技术的人才智能推荐方法
    魏云东
    2021, 0(07):  60-64. 
    摘要 ( 241 )   PDF (1586KB) ( 135 )  
    参考文献 | 相关文章 | 计量指标
    复杂多样的岗位信息使得很多求职人员很难查找到适合自己的岗位信息,为了提高人力资源的推荐质量,本文基于梯度提升树和混合卷积神经网络设计一种有针对性的人才市场推荐模型。利用流式分布式方法收集求职人员信息并将其转换为可用于算法分析的独热编码,使用梯度提升树提取求职人员特征。混合卷积神经网络在经过训练之后可实现有针对性的人才推荐。本文模型与不结合梯度提升树的混合卷积神经网络、结合梯度提升树的卷积神经网络相比,在召回率和F1-Score上分别提高了9.78%和10.1%。这说明,结合梯度提升树的混合卷积神经网络算法能够有效提高人力资源的推荐质量。
    人工智能
    基于条件对抗生成网络的对抗样本防御方法
    李世宝, 曹大鹏, 刘建航
    2021, 0(07):  65-70. 
    摘要 ( 177 )   PDF (831KB) ( 83 )  
    参考文献 | 相关文章 | 计量指标
    人工智能目前在诸多领域均得到较好应用,然而通过对抗样本会使神经网络模型输出错误的分类。研究提升神经网络模型鲁棒性的同时如何兼顾算法运行效率,对于深度学习在现实中的落地使用意义重大。针对上述问题,本文提出一种基于条件对抗生成网络的对抗样本防御方法Defense-CGAN。首先使用对抗生成网络生成器根据输入噪声与标签信息生成重构图像,然后计算重构前后图像均方误差,对比选取重构图像馈送到分类器进行分类从而去除对抗性扰动,实现对抗样本防御,最后,在MNIST数据集上进行大量实验。实验结果表明本文提出的防御方法更加具备通用性,能够防御多种对抗攻击,且时间消耗低,可应用于对时间要求极其苛刻的实际场景中。
    基于BERT-FNN的意图识别分类
    郑新月, 任俊超
    2021, 0(07):  71-76. 
    摘要 ( 762 )   PDF (989KB) ( 157 )  
    参考文献 | 相关文章 | 计量指标
    意图识别分类是自然语言处理领域的一个热点问题,在智能机器人、智能客服中如何根据上下文理解用户意图是一个重点问题,同时也是一个难点问题。传统的意图识别分类主要是采用基于规则、模板匹配的正则化方法或基于机器学习的方法,然而却存在计算成本高、泛化能力差的问题。针对上述问题,本文设计以Google公开的BERT预训练语言模型为基础,进行输入文本的上下文建模和句级别的语义表示,采用[cls]符号(token)对应的向量代表文本的上下文,再通过全连接神经网络(FNN)对语句进行特征提取,为了充分利用数据,本文利用拆解法的思想,将多分类问题转换成多个二分类问题处理,每次将一个类别作为正例,其余类别均作为负例,产生多个二分类任务,从而实现意图分类。实验结果表明,该方法性能优于传统模型,可以获得94%的准确率。
    图像处理
    基于SSD的小目标检测改进算法
    程凯强, 张旭, 寇旭鹏
    2021, 0(07):  77-82. 
    摘要 ( 241 )   PDF (1567KB) ( 84 )  
    参考文献 | 相关文章 | 计量指标
    目标检测算法因数据存在分辨率较低、噪声等干扰,不能有效利用特征图中目标的边缘纹理和语义信息,导致小目标检测效果较差。为此,本文提出一种基于SSD的小目标检测改进算法。首先,采用普通卷积和深度可分离卷积进行同步特征学习并融合,获得信息丰富的浅层特征。然后,在固有的5个尺度的特征层后添加通道和空间自适应权重分配网络,使得模型更关注通道和空间的重要特征信息。最后,将候选目标框进行非极大抑制筛选得到检测结果。通过将改进的方法与Faster RCNN、SSD等方法在VOC2007数据集上测试结果进行比较,该方法降低了小目标的误检率,提升了整体目标的精度,所提模型mAP达到了78.94%,比SSD网络提高了3.13%。
    医学图像融合技术在肿瘤放射治疗中的应用
    李文裕, 周凌宏
    2021, 0(07):  83-88. 
    摘要 ( 143 )   PDF (2285KB) ( 153 )  
    参考文献 | 相关文章 | 计量指标
    由于常规医学图像的有效信息量较少,参考常规医学图像会影响肿瘤病情的判断,导致肿瘤放射治疗临床效果较低,为此提出医学图像融合技术,并将其应用到肿瘤放射治疗工作当中。利用医学设备采集患者的初始医学图像,通过灰度化、负像化和直方图预处理医学图像。经过医学图像的配准空间变换,将参考图像与浮动图像导入配准空间内,保证映射点与像素原点重合,实现多模态医学图像的配准处理。采用融合算子融合医学图像的各个级别及系数,得到重构的医学融合图像。输出医学图像融合结果,将医学图像融合结果应用到肿瘤放射治疗中,确定靶区位置并调整放射剂量,实现患者肿瘤放射治疗。实验结果表明,将医学图像融合技术应用到实际的肿瘤放射治疗工作中,可以有效地提高肿瘤的临床治疗效果,具有较高的应用价值。
    基于改进YOLOv3的车辆尾灯检测方法
    李龙, 张重阳
    2021, 0(07):  89-94. 
    摘要 ( 320 )   PDF (1586KB) ( 124 )  
    参考文献 | 相关文章 | 计量指标
    在自动驾驶场景中,对前车尾灯的检测是一个广泛且具有研究意义的问题。Darknet53是YOLOv3的特征提取网络,其使用5个残差单元对原始图像进行特征提取并采用三尺度的特征图进行融合预测,尺寸越小对大目标的特征表达能力越强。因为尾灯检测属于小目标检测,所以本文舍去Darknet53的最后一个残差单元,同时增加小尺度特征提取残差单元的重复次数。针对K-means聚类算法存在k值难以确定以及对初始聚类中心敏感的问题,本文使用K-means+〖KG-*3〗+聚类算法获取anchor值,同时结合IOU距离度量指标。实验结果表明,改进后的YOLOv3网络上尾灯检测的准确率和检测速度都要高于改进前的,mAP由79.63%提高到89.32%,单张图片检测时间由0.014 s缩短到0.01 s。对比其他主流目标检测框架,本文改进的YOLOv3模型具有优越的检测性能。
    信息安全
    支持权限管理的高效属性撤销机制
    刘雪贞, 崔艳, 邓小飞, 彭杰
    2021, 0(07):  95-101. 
    摘要 ( 125 )   PDF (1166KB) ( 74 )  
    参考文献 | 相关文章 | 计量指标
    针对基于属性的访问控制模型中存在属性撤销后权限确定的问题,本文提出一种支持权限管理的高效属性撤销机制。该方案通过在访问控制机制中引入基于密文策略的属性加密机制CP-ABE来实现密文访问控制,将访问树用主析取范式来表示,主析取范式的每个子集即为访问主体访问资源所需满足的限定条件最小属性集。因此,当属性撤销时,通过判断最小属性集与被撤销属性的关系,来确定被撤销属性对主体的访问是否有影响,进而确定主体的访问权限。性能分析表明,该方案具有较高的安全性,不仅能够实现属性撤销后权限的确定,而且能够抵抗共谋攻击等。
    基于Portal认证技术的科技成果数据跨平台访问控制
    赵微, 秦砺寒, 运晨超
    2021, 0(07):  102-106. 
    摘要 ( 124 )   PDF (754KB) ( 71 )  
    参考文献 | 相关文章 | 计量指标
    为避免科技成果数据外泄,设计一种基于Portal认证技术的科技成果数据跨平台访问控制方法。采用Portal认证技术构建请求访问平台和科技成果数据服务平台的访问控制模型,当这2个平台通过访客身份认证后,对其进行信任度评估和访问请求授权;服务提供平台利用策略实施点(PEP)完成访问请求用户属性信息的收集并传送至PEP,采用推荐算子计算存在访问请求的用户信任度,并通过合一运算获取用户在科技成果数据服务平台的信任度。将获取的信任度传送至策略决策点(PDP),通过PDP对信任度进行分析,以给出是否对该访问请求进行授权的判定,实现科技成果数据跨平台访问控制。实验结果表明,该方法访问控制的有效性与精准度较高,平台响应时间短,实用性好。
    基于概念漂移检测的网络数据流分类
    章恒, 鞠时光
    2021, 0(07):  107-114. 
    摘要 ( 234 )   PDF (2251KB) ( 83 )  
    参考文献 | 相关文章 | 计量指标
    互联网环境日新月异,使得网络数据流中存在概念漂移,对数据流的分类也由传统的静态分类变为动态分类,而如何对概念漂移进行检测是动态分类的关键。本文提出一种基于概念漂移检测的网络数据流自适应分类算法,通过比较滑动窗口中数据与历史数据的分布差异来检测概念漂移,然后将窗口中数据过采样来减少样本间的不均衡性,最后将处理后的数据集输入到OS-ELM分类器中进行在线学习,从而更新分类器使其应对数据流中的概念漂移。本文在MOA实验平台中使用合成数据集和真实数据集对提出的算法进行验证,结果表明,该算法较集成学习算法在分类准确率和稳定性上有一定的提升,并且随着数据流量的增加,时间性能上的优势开始体现,适合复杂多变的网络环境。
    基于本地差分隐私的众包隐私保护方法
    赵龙, 龙士工,
    2021, 0(07):  115-119. 
    摘要 ( 207 )   PDF (953KB) ( 92 )  
    参考文献 | 相关文章 | 计量指标
    在移动互联网发展的今天,基于位置服务(LBS)技术在移动互联上取得显著进展。针对个人用户进行精确定位时,数据信息隐私存在着泄露风险的问题,本文提出一种基于本地化差分隐私的地理不可区分性的扰动方法。在用户的真实位置数据信息流出客户端前采用地理不可区分性位置扰动方式,作用于真实位置以得到近似位置数据,服务器端收到后制成二级区域网格图,之后采用差分隐私对该图的工人计数进行扰动,最后在空间范围查询下进行实验验证,并与满足ε-本地化差分隐私扰动算法进行对比,精确度提高2.7%,同时与平均划分隐私预算分配方式进行实验对比,提高区域计数精确度4.57%。
    基于生成式对抗网络的拟态蜜罐特征生成方法
    刘祎豪
    2021, 0(07):  120-126. 
    摘要 ( 357 )   PDF (1240KB) ( 110 )  
    参考文献 | 相关文章 | 计量指标
    拟态蜜罐借鉴生物拟态博弈思想,是一种综合运用“蜜罐模拟服务特征”的保护色机制和“服务模拟蜜罐特征”的警戒色机制进行诱骗博弈的动态蜜罐技术,其核心策略是特征生成与演化。生成式对抗网络(GAN)则是一种特征生成方法,它通过生成器与判别器之间的对抗博弈,使生成器生成的数据达到“以假乱真”的效果,其对抗博弈的思想与拟态蜜罐思想极为相近。本文提出一种基于生成式对抗网络的拟态蜜罐特征生成方法MMHP-GAN(Mimicry honeypot-GAN),通过对MMHP-GAN的结构及参数优化训练,产生真假难辨的蜜罐或服务新特征。实验表明,通过该方法生成的特征数据进行演化,服务可以有效抵抗攻击,并且通过对比,本文的方案要优于当前已有的特征生成方案。