计算机与现代化

张苗苗，张玉洁，刘明童，徐金安，陈钰枫

2018, 0(04): 1. doi:10.3969/j.issn.10062475.2018.04.001

摘要 ( 329 )

参考文献 | 相关文章 | 计量指标

目前，语义角色标注大多基于双向长短时记忆网络（BiLSTM）。但是，由于词向量表示由上下文窗口中的词嵌入拼接得到，导致其依赖于左右词嵌入的联合作用。针对该问题，引入Gate机制对词向量表示进行调整。为了获取更深层次的语义信息，对BiLSTM的深度进行扩展。此外，引入标签转移概率矩阵进行约束，并且使用条件随机场（CRF）融合全局标签信息得出最优标注序列。实验结果表明，该方法使得汉语语义角色标注的F1值提高1.71%。

基于粒度决策熵的属性约简

李华，江峰，于旭，杜军威，刘国柱

2018, 0(04): 7. doi:10.3969/j.issn.10062475.2018.04.002

摘要 ( 359 )

参考文献 | 相关文章 | 计量指标

近年来，人们越来越关注粗糙集中的属性约简算法，尤其是启发式的约简算法。为了度量属性重要度，人们把各种不同的信息熵模型应用到粗糙集中，同时在信息熵这一理论的基础上得出了许多约简算法，用来解决粗糙集中属性约简的问题。然而，现有的基于信息熵的方法还存在一系列问题。针对这些问题，本文首先将知识粒度与相对决策熵这2个概念结合在一起，从而引入一种新的信息熵模型——粒度决策熵；然后，利用粒度决策熵来度量属性的重要性，并由此得出新的约简算法——ARGDE约简算法；最后，用不同的UCI数据集来做实验，通过与已有的约简算法比较，该算法能够得到更好的实验结果。

带负项值的onshelf效用项集并行挖掘算法

陈丽娟，谢伙生

2018, 0(04): 13. doi:10.3969/j.issn.10062475.2018.04.003

摘要 ( 279 )

参考文献 | 相关文章 | 计量指标

为了提高带负项值的onshelf效用项集挖掘算法的挖掘效率，提出带负项值的onshelf效用项集并行挖掘算法DTPHoun，算法基于MapReduce框架，充分利用其onshelf时间段因素，将原始事务数据库按照时间段进行分片。算法将挖掘过程转化为MapReduce工作，Map阶段在分片数据库中挖掘候选项集，Reduce阶段并行计算候选项集的onshelf效用值。实验结果表明，算法取得了较高的挖掘效率。

基于改进kmeans算法的文本聚类

蒋丽，薛善良

2018, 0(04): 17. doi:10.3969/j.issn.10062475.2018.04.004

摘要 ( 280 )

参考文献 | 相关文章 | 计量指标

针对原始kmeans算法对聚类数k很敏感这一问题，设计一种改进的kmeans算法。该算法基于共现词的原理计算词向量之间的相似性，并根据相似性阈值将数据划分为k+x个簇，再将kmeans算法用于k+x个簇中。将改进后的算法应用于文本聚类中，实验结果表明，改进后的算法比原算法聚类准确性更高。

基于改进k近邻的直推式支持向量机学习算法

李煜，冯翱，邹书蓉

2018, 0(04): 22. doi:10.3969/j.issn.10062475.2018.04.005

摘要 ( 251 )

参考文献 | 相关文章 | 计量指标

针对直推式支持向量机(TSVM)需要遍历所有无标签样本花费时间长的缺点，提出一种基于改进k近邻法的直推式支持向量机学习算法——k2TSVM。该算法首先使用k均值聚类将无标签样本分成若干簇，然后求出每簇中心点的k近邻并根据其中正负样本个数对无标签样本进行删减，将删减后的数据集输入直推式支持向量机进行训练。k2TSVM改善传统TSVM需要遍历所有无标签数据的缺点，有效减少训练样本规模，能够提高运行速度。实验结果表明，k2TSVM在降低运行时间的同时，能够取得比类似TSVM改进算法更好的分类结果。


基于WEHG模型的GUI软件测试用例生成方法

向日锋，毛宇光

2018, 0(04): 26. doi:10.3969/j.issn.10062475.2018.04.006

摘要 ( 344 )

参考文献 | 相关文章 | 计量指标

图形用户界面（GUI）是底层代码的前端表示。针对基于现有的模型生成的测试用例集不能尽快找到软件缺陷的问题，本文从代码层和界面层出发对待测程序进行分析，提出一种GUI测试模型WEHG，该模型的特点是：1）根据事件处理函数中定义变量和引用变量的数量和给对应的节点设置权重值，从而保证拥有更多变量的节点能够优先生成测试用例；2）根据事件处理函数的定义引用对给节点之间的依赖关系设置依赖值，使依赖度高的节点能够优先加入测试序列中。对比实验结果表明，该方法能够更快地发现软件中的缺陷，提高测试用例的缺陷探测效率，降低软件测试的成本。

基于JNI和C+〖KG-*3〗+的Intel集成众核并行方法

桑喆1，邓川1，苟聪1，刘开兴2，白明泽1

2018, 0(04): 32. doi:10.3969/j.issn.10062475.2018.04.007

摘要 ( 413 )

参考文献 | 相关文章 | 计量指标

针对当前Intel集成众核协处理器（MIC）只能使用C/C+〖KG-*3〗+/Fortran编程语言进行并行计算，不能对已有的Java程序提供高性能计算支持的问题，提出基于Java Native Interface(JNI)技术和C+〖KG-*3〗+的MIC混合并行计算方法。该方法基于JNI设计Java代码与C+〖KG-*3〗+代码的数据交换机制，使MIC协处理器强大的浮点计算能力加速Java应用程序成为可能。通过实验测试分析基于MIC多线程并行的Java程序计算性能效果，结果表明该方法能有效利用MIC协处理器，对Java程序的计算性能提升显著。

基于非负矩阵分解与相似性分析的运动目标检测

范新南，薛瑞阳，史朋飞，李敏，倪建军

2018, 0(04): 37. doi:10.3969/j.issn.10062475.2018.04.008

摘要 ( 235 )

参考文献 | 相关文章 | 计量指标

提出一种结合修正的非负矩阵分解与向量相似性分析进行运动目标检测的方法。该方法首先使用修正后的非负矩阵分解算法从连续图像序列中恢复出背景图像，然后分析待检测帧像素点与恢复出来的背景模型之间的相似性，根据相似性的高低区分背景与前景。为了减少计算量，降低动态背景对检测结果的干扰，该方法在进行相似性分析之前，通过核密度估计的方法对运动区域进行估计。实验结果表明，该方法能够较为精确地恢复出背景图像，并有效地检测出运动目标。

基于颜色衰减先验和白平衡的水下图像复原

韩辉1，周妍1,2，蔡晨东1

2018, 0(04): 42. doi:10.3969/j.issn.10062475.2018.04.009

摘要 ( 366 )

参考文献 | 相关文章 | 计量指标

由于水体中悬浮颗粒对光线的吸收及散射作用，以及不同波长的光在水下的衰减程度不同，水下图像通常存在细节模糊、对比度低、颜色失真等问题。为改善水下图像质量，提出一种基于颜色衰减先验和白平衡的水下图像复原方法。首先，根据图像在HSV颜色空间中的颜色衰减先验获得场景深度图；其次，利用水下光学衰减特性估计RGB三通道对应的背景光强度与水下透射率，以实现水下图像的清晰化；最后，采用改进的白平衡方法对清晰化后的水下图像进行颜色校正。实验结果表明，该方法可以显著提升水下图像的细节清晰度与颜色保真度，视觉效果更接近自然场景下的图像。

基于深度学习的显著性检测方法模型——SCS

张洪涛，路红英，刘腾飞，张玲玉，张晓明

2018, 0(04): 48. doi:10.3969/j.issn.10062475.2018.04.010

摘要 ( 328 )

参考文献 | 相关文章 | 计量指标

提出一种基于深度学习的图像显著性区域检测方法，该方法对2种视觉注意机制所涉及的低级对比特征和高级语义特征分别进行提取，并结合2类特征进行模型训练最终得到基于分类思想的图像显著性区域检测模型——SCS检测模型。通过对比实验得出：该方法训练得到的检测模型在检测准确度上具有显著的优势。

基于图像轮廓分析的室内窗户检测

孔倩倩，赵辽英，张莉

2018, 0(04): 56. doi:10.3969/j.issn.10062475.2018.04.011

摘要 ( 337 )

参考文献 | 相关文章 | 计量指标

针对室内窗户检测的问题，提出一种基于图像轮廓分析的室内窗户检测方法。对预处理后的图像进行阈值分割和形态学处理；然后采用基于拓扑结构分析的边界跟踪算法，提取边界轮廓的一系列坐标点，根据窗户轮廓特点筛选出符合条件的轮廓，求各轮廓的最小外接矩形，计算两两最小外接矩形间的距离；最后利用最小生成树对各个矩形分类合并，确定窗户区域。实验结果表明，所提出的方法能有效地实现不同室内场景中窗户的检测。

基于可变形卷积神经网络的手势识别方法

苏军雄，见雪婷，刘玮，华俊达，张胜祥

2018, 0(04): 62. doi:10.3969/j.issn.10062475.2018.04.012

摘要 ( 328 )

参考文献 | 相关文章 | 计量指标

卷积神经网络本身具有丰富的特征表达能力和学习能力，但本质上，其模块中几何变换能力是固定的。因此，引入可变形卷积核来改进VGG16的网络结构，搭建名为DCVGG的卷积神经网络结构来进行手势识别的研究。在不同数据集下，基于可变形卷积神经网络的手势识别方法能够直接把RGB图像数据输入网络。最终输出的结果，对手势的平均识别率达到97%以上，有效提高网络的性能，提升卷积神经网络对样本对象的容忍度和多样性，丰富卷积神经网络的特征表达能力，与传统LeNet5、VGG16结构和传统人工特征提取算法相比效果更佳，比传统结构更深，鲁棒性更好，识别率更强，可以为复杂背景下有效识别手势提供参考，具有一定的延拓能力。

基于Ksupport稀疏逻辑回归的停电敏感度预测

耿俊成1，张小斐1，孙玉宝2，吴博1，周强2

2018, 0(04): 68. doi:10.3969/j.issn.10062475.2018.04.013

摘要 ( 258 )

参考文献 | 相关文章 | 计量指标

有效预测停电敏感度高的客户，可为电力服务部门开展精准营销和差异化服务提供数据与决策支持。本文提出一种基于ksupport稀疏逻辑回归的客户停电敏感度评价算法。不同于常用的l1范数，ksupport范数是对l0范数更为紧致的凸松弛，并能够同时选择多个关联性强的因子进行预测，有利于提升预测准确性。算法首先从客户基本信息、用电信息、缴费信息、95598工单、停电事件等多个维度筛选用于敏感性预测的自变量（因素），收集各用户的因素信息形成样本数据集。进一步构建停电敏感性预测的ksupport稀疏逻辑回归模型，建立模型快速求解的前向后向算子分裂迭代优化算法，转化为2个子问题的快速迭代。通过优势分析法确定回归模型中对目标变量具有显著影响的自变量因素。运用某省级电网公司近百万客户数据对建立的预测模型进行校验与评估，达到良好的预测准确率，实验结果验证了本文模型的有效性。

基于地理邻近性的自编码器在地点推荐中的应用

张文翔

2018, 0(04): 74. doi:10.3969/j.issn.10062475.2018.04.014

摘要 ( 214 )

参考文献 | 相关文章 | 计量指标

个性化地点推荐系统对于基于位置的社交网络（Locationbased Social Networks, LBSNs）的发展至关重要。它不仅能够帮助用户挖掘新的地点，同时也有利于服务商更好地提供个性化服务。现存关于这方面的研究，将所有的地点同等看待。但是在不同类别中，签到频率的数据规模却不可同等看待。本文基于TFIDF理论将签到频率转换成基于类别的偏好数据，提出一个基于地理邻近性的深度自编码器模型，利用签到数据中的地理信息构造推荐系统。在LBSNs真实数据集上进行实验分析，结果表明相对于对比算法，本文模型的实验结果更好，基于地理邻近性的深度自编码器模型适用于地点推荐任务。

基于改进Leaders算子的审计潜在疑点发现

邵锦炜1,林俊2,刘雅婷3,肖嘉丽4

2018, 0(04): 79. doi:10.3969/j.issn.10062475.2018.04.015

摘要 ( 187 )

参考文献 | 相关文章 | 计量指标

数据库查询方法审计疑点发现依赖于审计人员先验知识，当经验不足且审计数据量巨大时，难以发挥大数据优势并从海量数据中发现疑点。为解决这一问题，提出基于改进Leaders算子迭代聚类的审计大数据潜在疑点发现方法。该方法在无先验知识的情形下，通过Leaders算法自动完成审计大数据的初始聚类，在此基础上通过随机抽样融合方法对初始聚类结果优化，最后通过多次迭代聚类的方法，对实例数较少或可疑程度易被掩盖的小簇进一步聚类，实现审计大数据的精确聚类，并将实例较少且行为明显异常的数据聚类识别为潜在疑点，配合审计人员审计经验快速精确定位审计疑点。实验结果验证了算法的有效性，表明算法有助于从海量数据中自主发现审计疑点，缩小疑点筛查范围，提高审计效率。

基于Levenshtein和TFRSF的文本相似度计算方法

藏润强1，孙红光1,2，杨凤芹1,2，冯国忠1,2，尹良亮1

2018, 0(04): 84. doi:10.3969/j.issn.10062475.2018.04.016

摘要 ( 300 )

参考文献 | 相关文章 | 计量指标

在社交网络中查找和收集个人信息可以建立一个包含目标履历、生活、爱好以及朋友等属性的信息体系，但是不同社交网络中存在大量同名用户。为了解决同名歧义问题，采用计算用户信息相似度，可以判断2个用户是否属于同一个人。由于文档中描述信息位置颠倒会导致计算机误判，为此，本文通过对莱文斯坦（Levenshtein）和词频相关字符串频率（TFRSF）方法融合计算词频和编辑距离，判断属性值是否相同。实验结果表明，本文提出的计算文本相似度方法在多种评价指标上准确性都有所提高，准确率（Precision）、召回率（Recall）、F1值（F1 Measure）均大于87%。

基于知网与搜索引擎的词汇语义相似度计算

吴克介,王家伟

2018, 0(04): 90. doi:10.3969/j.issn.10062475.2018.04.017

摘要 ( 378 )

参考文献 | 相关文章 | 计量指标

提出一种基于知网与搜索引擎的词汇语义相似度计算方法。利用义原在层次体系树的深度、密度、信息量优化义原的相似性计算。将逐点共有信息（PMI）算法与归一化谷歌距离（NGD）算法结合优化基于搜索引擎的词汇语义相似度计算。将词汇的词性作为权重因子融合知网与搜索引擎的词汇相似度计算结果。实验结果表明，与基于知网和基于搜索引擎的语义相似度计算方法相比，所提出的方法在NLPCC测试集上的平均相似度更接近于测试集的评测标准，在汽车票务领域的词汇相似度计算中具有较好的应用效果。

基于改进贝叶斯模型的信息安全风险评估

黄玉洁，唐作其

2018, 0(04): 95. doi:10.3969/j.issn.10062475.2018.04.018

摘要 ( 554 )

参考文献 | 相关文章 | 计量指标

随着信息化时代的到来，信息安全问题变得日益复杂与多样，因此急需一种高性能的解决方法。本文在前人的研究基础上进一步改进贝叶斯网络模型在信息安全风险评估中的应用。首先分析信息系统风险元素种类，提出一种新的确定风险因素的方法，即建立因素之间常见关联关系；然后依据因素关联关系确定信息系统指标体系，并结合经验积累的条件概率，利用Matlab贝叶斯网络工具箱（BNT）构建完整的贝叶斯网络风险评估模型，其中包括对评估流程、方法使用及风险等级确定的分析；最后通过实例分析改进的贝叶斯评估模型，对实验数据推理出风险各等级概率。仿真结果与实际结论相一致，表明改进的贝叶斯评估模型能够准确反映信息系统安全风险等级，是一种有效且合理的评估方法。

基于改进免疫启发群聚集算法的群机器人自恢复方法

刘养菊，倪建军

2018, 0(04): 100. doi:10.3969/j.issn.10062475.2018.04.019

摘要 ( 242 )

参考文献 | 相关文章 | 计量指标

群机器人由许多简单的无差别的机器人组成，是多机器人系统的一个重要研究方向。虽然其相比个体机器人有良好的容错性和鲁棒性，但是在机器人发生局部故障——有信息交互能力但无驱动能力时，群机器人系统会受到影响。针对这一问题，以基于生物免疫系统原理的肉芽肿形成算法为基础，引入离散粒子群算法选取最优的自恢复策略，使群机器人系统实现故障自恢复并更快更有效地完成任务。仿真实验结果表明该算法在群机器人自恢复系统中具有良好的效果。

基于改进生物启发神经网络的机器人目标搜索方法

张智彤，倪建军，莫正佩

2018, 0(04): 106. doi:10.3969/j.issn.10062475.2018.04.020

摘要 ( 280 )

参考文献 | 相关文章 | 计量指标

针对未知环境下机器人目标搜索的问题，按照机器人能力不同对搜索区域进行划分，目标点在自己运动的过程中会在局部范围内留下信息素并且这些信息素会随着时间的流失而减少，机器人可以探测到这些信息素的多少进而影响机器人下一个搜索位置的选择。本文采用改进生物启发神经网络选取机器人探索范围内活性值最大的点作为下一个搜索位置。为了防止在连续的时间段内多次选择相同的点，引入禁忌搜索，把多次选择相同的点放入禁忌表中，可以有效防止陷入局部最优点。与随机搜索方式和原始的生物启发神经网络进行对比，验证了该方法对动态目标的搜索具有良好的效果。

基于OSG的三维雷达探测范围构建与优化实现

任菲,王家润,李小娟,尹辉

2018, 0(04): 111. doi:10.3969/j.issn.10062475.2018.04.021

摘要 ( 479 )

参考文献 | 相关文章 | 计量指标

为了帮助指挥员在电子对抗中准确判断态势，研究三维雷达探测范围构建与优化实现技术。基于OpenSceneGraph（OSG）三维图形引擎，结合雷达探测范围二维包络线和雷达天线垂直方向图函数，实现了三维雷达探测范围的通用计算方法。针对雷达数据量大、数据实时更新的特点,分2个阶段进行优化：降低算法复杂度，优化计算方法；使用OSG的多线程技术，对计算绘制过程进行并行处理。通过试验与分析，验证了本文方法的高效性。

基于蚁群路径优化决策树及逻辑回归的慢性肾病进展概率预测模型

冯苗1，綦小蓉2，李智1

2018, 0(04): 117. doi: 10.3969/j.issn.10062475.2018.04.022

摘要 ( 214 )

参考文献 | 相关文章 | 计量指标

慢性肾病（Chronic Kidney Disease, CKD）是一种进展性疾病，早期若不及时加以治疗会导致病情发展，甚至肾衰竭。为了研究CKD患者从早期发展到终末期的概率，本文提出一种CKD进展概率预测模型：结合蚁群路径优化决策树算法(Decision Tree Ant Path Optimization, DTAPO)和逻辑回归算法（Logistic Regression, LR），将CKD患者数据分为P（进展）和NP（非进展）2类，得到分类精确率和召回率，从而计算CKD患者由3期进展到4期或5期的概率。实验结果表明，当特征数目为13时，结合逻辑回归的蚁群路径优化决策树算法的预测效果最好，其分类精确率为98.84%，由该精确率预测得到的进展患者确实由3期进展到4期或5期的概率为0.9827。

基于ARIMA模型的二手房价格预测

郑永坤，刘春

2018, 0(04): 122. doi:10.3969/j.issn.10062475.2018.04.023

摘要 ( 444 )

参考文献 | 相关文章 | 计量指标

摘要：近年来，我国一二线城市房价持续上涨，房屋成了人们日常生活讨论的热门话题，大家纷纷对未来的房价走势做出猜测。本文爬取国内某知名大型房产网站自2013年以来广州和深圳的二手房均价数据，采用ARIMA模型对未来的房价进行滚动预测，并使用RMSE对预测精度进行判断。结果表明，该模型可以对二手房均价进行持续预测，且预测精度较高，可为房屋买卖者提供参考。

当期目录