计算机与现代化 ›› 2025, Vol. 0 ›› Issue (02): 86-93.doi: 10.3969/j.issn.1006-2475.2025.02.012
摘要: 自然场景文本图像超分辨率方法旨在提高文本图像的分辨率和可读性,进而提升下游高级文本识别任务的性能。现有研究通过引入文本先验信息能够更好地指导超分辨率重建过程。然而,这些方法未能有效利用文本先验信息并将其与图像特征充分融合,从而限制了超分辨率任务的性能。基于此,本文提出一种基于孪生特征融合网络(Twin Feature Fusion Network, TFFN)的自然场景文本图像超分辨率方法,该方法旨在最大化利用来自预训练文本识别器中的文本先验信息,使其专注于文本区域内容的恢复。首先,利用文本识别网络提取文本先验信息;其次,构建一种孪生特征融合模块,该模块采用孪生注意力机制促进图像特征和文本先验信息之间的双向交互,并利用融合模块进一步融合上下文增强的图像特征和文本先验信息;最后,提取序列特征并重建超分辨率图像。实验结果表明,本文方法在TextZoom数据集的不同难度等级中,ASTER、MORAN和CRNN这3个文本识别网络中的识别准确率分别提升了0.22~0.5、0.6~1.1以及0.33~1.1个百分点。
中图分类号: