计算机与现代化 ›› 2025, Vol. 0 ›› Issue (09): 61-66.doi: 10.3969/j.issn.1006-2475.2025.09.009
摘要:
摘要:近年来,人脸素描-照片合成技术因其在执法、刑事及娱乐等领域的需求,成为研究热点。CycleGAN作为一种无需配对图像监督的深度学习模型,擅长图像跨域转换,为素描与照片间的高效转换提供了有力工具。鉴于收集大量成对的人脸图像和素描图像存在较大难度,同时人脸素描图像生成任务中存在图像细节模糊和低清晰度的问题,提出一种改进的CycleGAN模型。本文在CycleGAN模型中ResNet架构的生成器的残差块中引入自注意力机制,使得 CycleGAN的生成器模型能够更有效地学习不同通道特征以及人脸图像中不同区域的重要程度,在处理图像时自动聚焦于面部特征的重要区域,如眼睛、鼻子、嘴巴等,同时增加素描的边缘清晰度与完整度,从而提升生成的人脸素描图像质量。在数据集CUHK和FS2K上进行实验,本文模型的图像质量评估指标结构相似性、峰值信噪比、多尺度结构相似度在数据集CUHK上分别为0.7741、11.7451、0.8504,在数据集FS2K上分别为0.7049、13.2745、0.7970,优于对比的CycleGAN、Pix2Pix、MUNIT、DCLGAN模型。对比实验以及主观视觉结果表明,本文模型能够有效地完成人脸素描化的过程,并生成较高质量的人脸素描图像。
中图分类号: