Please wait a minute...

当期目录

    2018年 第0卷 第06期    刊出日期:2018-07-05
    算法设计与分析
    基于上下文语义的朴素贝叶斯文本分类算法
    郑开雨,竹翠
    2018, 0(06):  1. 
    摘要 ( 94 )  
    参考文献 | 相关文章 | 计量指标
    朴素贝叶斯分类器基于样本各属性相互条件独立的假设前提,它作为一种简单的词袋模型,忽略了上下文语境下同义词对分类的影响。本文提出相似词概念,使用相似词词簇代替传统的特征词典参与训练。首先训练word2vec得到词向量。然后,将特征词典用词向量表示后层次聚类,构建相似词词簇,并对其扩展。实验结果表明,改进后算法有效提高了文本分类的准确度,避免了因分类训练语料的差异导致分类效果的不稳定。
    基于LDA模型的文本聚类检索
    李霄野,李春生,李龙,张可佳
    2018, 0(06):  7.  doi:10.3969/j.issn.1006-2475.2018.06.002
    摘要 ( 204 )  
    参考文献 | 相关文章 | 计量指标
    传统的判断2个文档相似性的方法没有考虑到文本背后的语义关联,导致检索系统返回的结果与用户的查询需求之间存在很大的差异。本文提出一种基于LDA主题模型的文本聚类方法,首先介绍LDA主题模型的应用原理,阐述文本挖掘的基本方法,之后构建LDA主题模型,采用Gibbs抽样的方法进行推导,得到特征词的概率分布,最后用优化聚类中心选择的K-means+〖KG-*3〗+方法对测试数据集合聚类,并把设计的LDA-Gibbs模型与传统的TF-IDF模型进行聚类评价对比。实验结果表明,该模型能够提高数据的检索效果,具有良好的推广价值。
    算法分析与设计
    神经网络在经济市场波动率建模与预测中的应用
    谢荣燕
    2018, 0(06):  12.  doi:10.3969/j.issn.1006-2475.2018.06.003
    摘要 ( 156 )  
    参考文献 | 相关文章 | 计量指标
    本文提出一种马尔可夫交换人工神经网络,应用于经济市场中的黄金市场的波动性建模与预测。本文所提出的模型在条件波动过程的动态性与传统神经网络模型相比,在预测能力上有所不同。在本文中,应用此类模型来检验黄金收益率的波动性。对绝对误差、均方误差和均方根误差准则加以评估,并且在相同精度下进行改良的DieboldMariano测试。为黄金市场日收益的预测提供了一个实证应用,结果表明,该方法在模拟和预测国际黄金日收益波动性方面具有较好的效果。
    多目标遗传算法在船闸调度中的应用
    毛星,徐希涛
    2018, 0(06):  16.  doi:10.3969/j.issn.1006-2475.2018.06.004
    摘要 ( 128 )  
    参考文献 | 相关文章 | 计量指标
    针对传统水运调度效率低下的现象提出一种基于优化多目标遗传算法的船闸调度方法。借鉴生物进化过程,将船闸排档结果定义为进化对象的个体,进行染色体编码和种群初始化;根据不同调度指标构建目标函数,对初始种群进行个体适应度计算;反复按序进行选择操作、交叉操作和变异操作,从全局的角度进行评估决策,输出满足调度需求的最优排档方案,并使用长洲船闸的实际数据进行实验,结果表明该方法既提高船闸利用率又缩短调度时间。
    DoFFT:一种基于分布式数据库的快速傅里叶变换方法
    季朋1,2,李晖1,2,陈梅1,2,戴震宇1,2
    2018, 0(06):  19.  doi:10.3969/j.issn.1006-2475.2018.06.005
    摘要 ( 197 )  
    参考文献 | 相关文章 | 计量指标
    快速傅里叶变换在天文学中有着广泛的应用。例如,脉冲星信号通常需要基于快速傅里叶变换进行相干消色散处理。由于信号数据通常存储在数据库中,而将数据从数据库取出后再由外部程序进行快速傅里叶变换处理将产生大量I/O和网络开销进而严重影响整体处理性能。针对此问题,本文设计一种用户自定义函数(UDF)形式的可在分布式数据库中并行执行和优化快速傅里叶变换的算法DoFFT(DatabaseoptimizedFFT)。此外,针对数据库集群中每台机器负载不同、数据分布不均匀等有时会导致执行效率低下的问题,DoFFT方法基于CPU、I/O,网络与传输速率等的代价,对涉及的数据进行数据重分布处理,以进一步优化快速傅里叶变换的并行执行。实验结果表明,采用基于数据重分布的优化后,DoFFT算法的性能得到了有效提升。
    基于动态调整惯性权重的混合粒子群算法
    顾明亮,李旻
    2018, 0(06):  25.  doi:10.3969/j.issn.1006-2475.2018.06.006
    摘要 ( 161 )  
    参考文献 | 相关文章 | 计量指标
    标准粒子群算法(ParticleSwarmOptimization,PSO)在求解高维非线性问题时容易陷入局部最优解,针对此种情况,提出一种基于Sigmod函数的新的非线性自适应权值调整策略。此外,选用拉丁超立方体抽样的方法产生均匀的初始种群,采用小生境淘汰策略增强算法全局寻优能力。最后选用6个标准测试函数对该改进算法进行性能测试。结果表明,改进的粒子群算法在收敛速度和收敛精度以及全局最优解的获取方面均取得了满意的效果。
    信息安全
    一种基于关联分析和HMM的网络安全态势评估方法
    吴建台,刘光杰,刘伟伟,戴跃伟
    2018, 0(06):  30.  doi:10.3969/j.issn.1006-2475.2018.06.007
    摘要 ( 218 )  
    参考文献 | 相关文章 | 计量指标
    当前大部分基于隐马尔科夫(HMM)的网络安全态势的评估方法都集中于对HMM参数的研究,而忽视了观测值的选取对评估准确度的影响。本文在告警信息聚合的基础上,以攻击模式作为关联依据,结合网络资产的脆弱性信息,识别主机所处受攻击阶段并转化为主机的威胁等级,以威胁等级作为HMM的观测值,最后利用HMM实现对主机和网络的安全态势评估。基于DARPA2000测试数据集的相关实验表明,相比一般的HMM方法,本文方法能体现攻击的多步骤特点,且能更加准确地反映网络态势的变化。
    基于SBT全结点存储的云数据完整性
    周鹏1,2,龙士工1,2
    2018, 0(06):  37.  doi:10.3969/j.issn.1006-2475.2018.06.008
    摘要 ( 92 )  
    参考文献 | 相关文章 | 计量指标
    云存储可以为用户提供高质量、按需分配的数据存储服务,使用户用低廉的价格就能享受到海量的存储能力,但是对于用户而言,云存储服务器并不是完全可信,因此会担心存储在云端的数据出现安全性问题,同时为了满足云中的应用,需要完整性验证机制支持全动态操作以及第三方公开认证。因此,提出一种基于全结点存储的云数据完整性方案。引入平衡二叉搜索树结构——结点大小平衡树(SizeBalancedTree,SBT),该结构使得树中所有的结点都可以用来存储实际的数据,相比叶子结点存储的树,无疑减少了服务器上的空间开销,同时降低了树的高度,从而也降低了进行数据插入删除等基本操作的时间复杂度。该方案在支持动态操作上具有更好的效率,能够很好地支持云存储环境下数据完整性验证。
    基于K-means算法的地铁站台异物检测
    雷焕宇,刘伟铭
    2018, 0(06):  42.  doi:10.3969/j.issn.1006-2475.2018.06.009
    摘要 ( 172 )  
    参考文献 | 相关文章 | 计量指标
    针对地铁屏蔽门和列车门之间的间隙会产生夹人夹物等地铁运营安全事故隐患,提出一种基于K-means的地铁站台异物面检测方法。该方法通过采用人工构造光学背景,并且采用HSV颜色空间来提高检测的效率和准确度。算法采用K-means方法对车首摄像头拍摄车尾灯带图像进行目标提取,通过对目标的完整性计算来判断列车车体与屏蔽门缝隙是否存在空间异物。通过对真实视频数据进行实验,结果表明所提算法对光照变化具有很好的鲁棒性,可以准确检测出各种异物,能够辅助司机进行开车前的决策。
    图像处理
    一种基于SURF与地理格网模型的增强现实方法
    毕金强,许家帅,辛全波,尚东方
    2018, 0(06):  47.  doi:10.3969/j.issn.1006-2475.2018.06.010
    摘要 ( 128 )  
    参考文献 | 相关文章 | 计量指标
    图像识别与匹配是增强现实领域研究与应用的基础和关键,针对户外场景的广域性和随机性,以及目标纹理结构相似性等问题,提出一种基于SURF与地理格网模型的增强现实方法。该方法根据目标场景与地理位置的相关性,检测图像特征点并生成Location-SURF图像特征描述,基于地理格网模型构建空间四叉树索引,建成静态特征样本库。将视频帧、位置和角度信息生成特征图像,上传至服务端解析运算并与样本库训练匹配。选取宁波环球航运广场约0.376km2的区域,采集270余幅图像数据构建样本库并开展试验,通过现场图像的实时采集和计算,能够实现特征点的在线匹配,在此基础上通过调整点位距离比例的阈值,能够提升匹配的准确程度。基于该算法开发移动增强现实系统,运用四层技术架构实现了终端采集显示和服务端分析计算的并行化,达到真实场景与虚拟信息的融合显示效果。系统应用结果表明:该算法可以解决复杂环境下场景图像识别匹配率不高的问题,可快速地完成特征点的检测和提取,能够有效地进行样本训练和匹配,对户外移动增强现实进行了有益尝试并提供一种有效的途径。
    基于反应扩散和非局部自相似的图像去噪算法
    莫佩基1,2,雷宏1
    2018, 0(06):  54.  doi:10.3969/j.issn.1006-2475.2018.06.011
    摘要 ( 150 )  
    参考文献 | 相关文章 | 计量指标
    为了更好地利用图像先验以及保护图像边缘、纹理等细节信息,提出一种结合反应扩散(TrainedNonlinearReactionDiffusion,TNRD)与基于块组先验去噪(PatchGroupPriorbasedDenoising,PGPD)的改进算法。首先,对PGPD去噪后的图像进行小波分解得到3个正交的子带,由理论分析可知图像为各子带之和;然后利用反应扩散对高频系数大于阈值的子带部分进行扩散处理,并将处理结果替代原来部分从而获得最终去噪图像。实验结果表明,改进算法在峰值信噪比、保护细节信息等方面都有较大的性能改善。
    类别不平衡的多任务人脸属性识别
    张文
    2018, 0(06):  58.  doi:10.3969/j.issn.1006-2475.2018.06.012
    摘要 ( 160 )  
    参考文献 | 相关文章 | 计量指标
    属性的识别对物体的识别起到了比较重要的作用,例如人脸验证和场景识别。提高属性的识别率对后面基于属性特征的应用的正确率有很大的影响。近些年来,有些工作也开始关注于属性的学习,而很多的工作都是基于属性之间独立的假设,但在实际中很多的属性都是强相关的,例如没有胡子和女性,光头和头发的颜色;很多的工作忽略了类别之间的不平衡性,例如光头的样本比例可能只占样本的很小一部分。基于这2个观察,本文提出一种基于多任务的类别不平衡的人脸属性识别网络架构,该网络结构是由Densenet修改而来。该方法比以往的方法效果要好,一定程度上缓解了不平衡问题,且参数少,计算效率更高,在公开人脸属性数据集CelebA和LFWA上的实验验证了该方法的有效性。
    应用与开发
    基于动作评价算法的体感舞蹈交互系统
    于景华,王庆,陈洪
    2018, 0(06):  64.  doi:10.3969/j.issn.1006-2475.2018.06.013
    摘要 ( 231 )  
    参考文献 | 相关文章 | 计量指标
    广场舞是群众参与度极高的体育锻炼、娱乐社交的方式,针对广场舞活动的特点以及实际实施中存在的问题,研究分析并改进动作评价算法,对Kinect实时捕捉的人体骨骼动作序列进行评价,设计并集成一套基于Kinect的面向基层公共文化服务的广场舞体感交互应用系统。该技术充分发挥数字化体感交互体验的作用,用户在参与过程中能够充分调动身体主观能动性,为基层群众文化活动提供了新的活动方式以及极大的便利性。
    VISDMiner:一个交互式数据挖掘过程可视化系统
    王永胜1,2,李晖1,2,陈梅1,2,戴震宇1,2,朱明3
    2018, 0(06):  72.  doi:10.3969/j.issn.1006-2475.2018.06.014
    摘要 ( 224 )  
    参考文献 | 相关文章 | 计量指标
    针对数据挖掘中挖掘过程不透明以及用户交互少的问题,本文设计并实现了VISDMiner系统。VISDMiner系统将可视化技术和数据挖掘技术结合在一起,提供对挖掘过程中各阶段产生的可视化子结果集的分析。用户可根据自己的领域知识和经验去调整数据挖掘算法模型的参数和可视化模型的参数,促进算法和挖掘分析过程的有效调优。为了处理高维数据集,VISDMiner系统采用一种基于最大信息系数的主成分分析改进算法MIC-PCA,该算法主要是针对传统PCA算法降维能力和分类准确率低的问题进行改进。实验结果表明,VISDMine不仅实现了数据挖掘过程的可视化,还提高了用户对数据挖掘〖JP2〗执行结果的可理解性,其采用的改进的MIC-PCA算法提高了PCA算法的降维能力和分类准确率。
    一种非接触式多种液体的精确量取与混合系统
    陈旻哲,熊诚,刘守印
    2018, 0(06):  79.  doi:10.3969/j.issn.1006-2475.2018.06.015
    摘要 ( 97 )  
    参考文献 | 相关文章 | 计量指标
    针对市场缺失一款家用或商用自动化仪器来进行各种液体的高效、高质量、个性化调配,设计并实现了一套以PIC18F单片机为核心的液体调配系统。系统通过前端与用户交互,获取用户需求,传输给底层调配仪,并使用创新设计的2种新型装置对预装好的多种液体进行自动化非接触式的精确量取与混合,从而快速调配出个性化定制的混合液体。实际测试表明,该系统自动化程度高、可移植性强,仪器调配精度高、速度快、成本低、体积小,能够满足大部分商用或家用的液体调配需求。
    基于代价敏感主动学习算法的2型糖尿病诊断
    许智彪
    2018, 0(06):  84.  doi:10.3969/j.issn.1006-2475.2018.06.016
    摘要 ( 153 )  
    参考文献 | 相关文章 | 计量指标
    建立2型糖尿病诊断模型,并通过主动学习解决医疗数据中标记样本较少的问题。2型糖尿病的诊断可以被看作一个代价敏感的二分类问题,本文基于逻辑回归模型、支持向量机模型和人工神经网络模型,采用基于期望误差减小的代价敏感主动学习方法,将主动学习算法和代价敏感分类算法相结合来构建诊断模型,将不同的误分类代价考虑到样本的选择中。在2型糖尿病诊断问题中,基于期望误差减小的代价敏感主动学习算法表现最优,以较少的样本标记达到了最低的误分类代价,因此主动学习算法能够减少医疗数据挖掘中需要标记的样本数,节省标注成本,同时保证模型的性能。
    基于正态分布的光功率状态分析研究与应用
    韩君龙
    2018, 0(06):  91.  doi:10.3969/j.issn.1006-2475.2018.06.017
    摘要 ( 132 )  
    参考文献 | 相关文章 | 计量指标
    为了形成全网的光功率运行状态分析,本文采用概率统计的基本方法,首先对光功率数值在频率上进行正太分布可视化,然后从理论上对其正态分布进行验证,最后构建基于正太分布的光功率概率统计数据分析模型,实现光功率定量化分析,并在某铁路传输网中部署应用测试,提高了光功率数据使用价值和智能管理水平,测试结果能够满足光功率实际应用需求。
    目标跟踪器性能评估方法研究进展
    王全宁1,2,周进1,雷涛1,唐自力3
    2018, 0(06):  95.  doi:10.3969/j.issn.1006-2475.2018.06.018
    摘要 ( 197 )  
    参考文献 | 相关文章 | 计量指标
    规范的评估方法可以在客观公正的基础上,准确反馈算法性能,比较不同算法,推动跟踪算法发展,指导工程应用。本文从目标跟踪算法的评估测量方法、常用的数据集和现有的评估项目3个方面,总结性能评估方法的研究进展。简要说明评估方法类型和单目标与多目标评估的差异,详细分析常用评估测量指标及其特点,介绍代表性的数据集和评估项目,最后对评估方法的发展进行探究。
    基于大数据技术和特征推荐的就业信息管理平台的设计
    李健,杨幸,李俊成,黄晗文
    2018, 0(06):  103.  doi:10.3969/j.issn.1006-2475.2018.06.019
    摘要 ( 153 )  
    参考文献 | 相关文章 | 计量指标
    就业工作是职业院校的一项重要工作,就业信息管理平台是学校就业指导、管理和服务的重要手段。就业信息管理平台应用效果的关键是招聘职位的数量和质量,其核心是能根据学生的就业期望,实现职位的有效推荐,同时,构建政府、企业、学校、学生之间快速沟通的渠道,提高就业指导和服务水平,提供就业调查反馈和就业统计分析功能,为专业人才培养的优化提供支撑。本文对就业信息管理平台的功能进行分析,利用软件工程的思想和统一建模工具,使用Web技术、爬虫技术、数据库技术、大数据处理技术和推荐算法对就业信息管理平台进行了设计与实现,实践表明,该平台能有效满足个性化就业需求,提高就业管理的质量和服务水平。
    分布式水产品流通全环节追溯体系的设计与实现
    曾祥卫1,李引2,郭畅2
    2018, 0(06):  108.  doi:10.3969/j.issn.1006-2475.2018.06.020
    摘要 ( 113 )  
    参考文献 | 相关文章 | 计量指标
    建设水产品流通质量安全追溯体系是保障水产品质量和安全的重要措施之一。针对水产品流通环节的监管问题进行研究,提出一个包括国家、省级、企业三级追溯平台的分布式水产品流通全环节追溯体系的设计方案。该体系以水产品追溯码为核心,事件数据为索引,提供向上游能追溯到水产品生产者,向下游能追溯到销售者,流通信息随时可查的功能,为我国消费者的消费权益提供有力保障,为我国水产品行业的可持续发展保驾护航。
    面向食品产品生命全周期的分布式食品电子追溯平台
    李引,罗海飙,刘东成,欧阳韵雄,陈健彬,袁峰
    2018, 0(06):  116.  doi:10.3969/j.issn.1006-2475.2018.06.021
    摘要 ( 48 )  
    参考文献 | 相关文章 | 计量指标
    当今社会食品安全事故层出不穷,食品安全问题已成为一个重大社会问题。食品溯源被证明是保障食品安全的一个有效手段。本文设计基于分布式架构的食品电子追溯平台,为食品企业提供生产经营管理服务,为监管部门提供食品生产流通全周期的正向和逆向追溯服务,为社会大众提供多种方式的食品溯源服务。平台通过建立统一的商品流通数据池,将食品生产和流通全供应链以及监管部门数据打通。基于商品流通数据池,不仅可以追溯到商品的生产和流通信息,查询到商品的检验检疫信息,还可以向食品供应链上的各个企业提供产品销量分析、产品存量分析等企业增值服务。平台依据国家食药监总局拟定的食品电子溯源标准建设数据库和数据接口标准,保证了接口的标准性和与其它溯源平台的兼容性。目前平台已在广东省上线运行,实现了省内流通的婴幼儿配方食品(乳粉、米粉、谷粉等)、食用油和酒类等重点监管品种的追溯和食品全品种可查询。公众可利用广东食品溯源门户、移动APP、微信或超市内的自助终端,通过扫描或者输入追溯码、商品码等方式,查询食品生产企业许可信息、产品抽检信息、流通环节信息,对有追溯码的产品还可实现真伪查询,为公众提供安全保障,提振消费信心。