计算机与现代化

• 图像处理 • 上一篇    下一篇

基于多层信息融合的实时语义分割及其在电力场景中的应用

  

  1. (国网浙江省电力有限公司信息通信分公司,浙江杭州310007)
  • 收稿日期:2019-01-28 出版日期:2019-08-15 发布日期:2019-08-16
  • 作者简介:周晨轶(1993-),男,浙江杭州人,助理工程师,硕士,研究方向:信息化项目管理,E-mail: macarzhou@163.com; 王文(1985-),男,浙江衢州人,工程师,本科,研究方向:信息化项目管理; 卢杉(1992-),男,浙江丽水人,助理工程师,硕士,研究方向:信息化项目管理; 徐亦白(1992-),男,山东枣庄人,助理工程师,硕士,研究方向:信息化项目管理。
  • 基金资助:
    国网浙江省电力有限公司科技项目(5211XT17000C)

Real-time Semantic Segmentation Based on Multi-scale Fusion #br# and Its Application in Electric Power Scene

  1. (State Grid Zhejiang Electric Power Co. Ltd. Information and Communication Branch, Hangzhou 310007, China)
  • Received:2019-01-28 Online:2019-08-15 Published:2019-08-16

摘要: 语义分割是计算机视觉的一项基础工作。本文提出一种新型的结合点卷积与空洞卷积的上采样结构,并基于该结构设计一个能融合多层信息的实时语义分割模型。该模型在Cityscapes数据集上的mIoU能达到72.1%,对于640×360的输入图像,运行速度能达到125 fps,同时该模型在电力场景数据集下也有很好的效果。此外,本文还将该模型移植到移动端,实现一款基于语义分割的电力场景增强现实应用。

关键词: 深度学习, 语义分割, 卷积神经网络, 电力场景

Abstract: Semantic segmentation is a basic work in computer vision. In this paper, a new upsampling structure combined point-wise convolution with dilation convolution is proposed and a real-time semantic segmentation model is designed based on this structure. The model can reach 72.1% mIoU and 125 fps running speed with the input of 640×360 on Cityscapes data set and has also good performance on a electric power scene data set. In addition, the paper transplants the model to the mobile terminal and implements an augmented reality application of electric power scene based on semantic segmentation.

Key words: deep learning, semantic segmentation, convolutional neural networks, electric power scene

中图分类号: