计算机与现代化

• 人工智能 •    下一篇

基于Gate机制与BiLSTMCRF的汉语语义角色标注

  

  1. (北京交通大学计算机与信息技术学院,北京100044)
  • 出版日期:2018-04-28 发布日期:2018-05-02
  • 作者简介:张苗苗(1992),女,山东济宁人,北京交通大学计算机与信息技术学院硕士研究生,研究方向:自然语言处理,语义分析; 张玉洁(1961),女,河南安阳人,教授,博士,研究方向:自然语言处理,机器翻译; 刘明童(1993),男,四川广元人,博士研究生,研究方向:自然语言处理,复述; 徐金安(1970),男,副教授,博士,研究方向:自然语言处理,机器翻译; 陈钰枫(1981),女,副教授,博士,研究方向:自然语言处理,机器翻译。
  • 基金资助:
     国家自然科学基金资助项目(61370130, 61473294); 北京市自然科学基金资助项目(4172047); 北京交通大学人才基金资助项目(KKRC11001532)

#br#    Chinese Semantic Role Labeling Based on Gated Mechanism and BiLSTMCRF

  1. (School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044, China)
  • Online:2018-04-28 Published:2018-05-02

摘要: 目前,语义角色标注大多基于双向长短时记忆网络(BiLSTM)。但是,由于词向量表示由上下文窗口中的词嵌入拼接得到,导致其依赖于左右词嵌入的联合作用。针对该问题,引入Gate机制对词向量表示进行调整。为了获取更深层次的语义信息,对BiLSTM的深度进行扩展。此外,引入标签转移概率矩阵进行约束,并且使用条件随机场(CRF)融合全局标签信息得出最优标注序列。实验结果表明,该方法使得汉语语义角色标注的F1值提高1.71%。

关键词: 汉语语义角色标注, Gate机制, BiLSTMCRF, 标签转移概率矩阵

Abstract: With the increasing research and application of deep learning, researchers have proposed a method by applying bidirectional long shortterm memory (BiLSTM) to semantic role labeling. Among them, many methods rely on a local window in word representation. In this case, the word representation may depend on the joint effect of some fixed word embeddings and it may preserve useless information in context. Aiming at this problem, we make improvements based on BiLSTM and introduce a Gated mechanism (GM) to filter information that will be fed to the next layer. In order to gain much more semantic information, we extend the depth of the BiLSTM. Due to the strong dependencies across output labels, we model tagging decisions using a conditional random fields (CRF) and transition matrices. Experiments on CPB benchmark dataset show that the F1 score of the Chinese semantic role labeling system finally improves 1.71%.

Key words:  Chinese semantic role labeling, Gated mechanism, BiLSTMCRF, transition matrix

中图分类号: