计算机与现代化 ›› 2024, Vol. 0 ›› Issue (02): 69-74.doi: 10.3969/j.issn.1006-2475.2024.02.011
摘要: 摘要:命名实体识别旨在从非结构化文本中提取实体,实体之间通常存在嵌套结构。然而,以往的研究大多只关注平面命名实体的识别,而忽略了嵌套实体。因此本文提出一种基于语义分割的嵌套命名实体识别方法,该方法将嵌套命名实体识别任务表述为一个语义分割任务。首先,计算单词和单词之间的元素相似性、余弦相似性以及双线性相似性;然后将3种相似性特征拼接作为一个图像输入到语义分割模型中,得到单词和单词之间的关系矩阵;最后,从关系矩阵提取出嵌套实体。实验结果表明,本文方法可以有效地识别出嵌套实体,在公开嵌套命名实体识别数据集GENIA上的F1值达到80.0%,优于现有大多数嵌套实体识别方法。
中图分类号: