计算机与现代化 ›› 2025, Vol. 0 ›› Issue (02): 52-57.doi: 10.3969/j.issn.1006-2475.2025.02.007
摘要: 人才职称评定领域中蕴含着大量人才履历信息,但履历信息通常以自然语言的形式存在,难以从中抽取关键信息作为人才职称评定依据。为了解决此问题,本文将实体抽取和关系抽取进行联合建模,构建一种面向人才履历信息的三元组联合抽取模型(RLAC)。首先,通过中文预训练语言模型RoBERT-wwm对人才履历信息进行底层编码;其次,引入LSTM网络和注意力机制改善人才履历信息难以识别头实体问题,增强编码上下文语义特征提取能力;再次,将编码后的信息输入至头实体标注器中获得头实体;最后,将头实体与人才履历信息进行拼接后输入至尾实体关系标注器中缓解关系重叠问题,从而获得三元组。在人才履历数据集上的实验结果表明,与基线模型相比,本文模型在精确率、召回率以及F1值上均有提升,具有良好的三元组抽取能力。
中图分类号: