2 个月前
在野外编辑文本
Liang Wu; Chengquan Zhang; Jiaming Liu; Junyu Han; Jingtuo Liu; Errui Ding; Xiang Bai

摘要
本文关注在自然图像中编辑文本的问题,目标是在保持真实感的前提下替换或修改源图像中的某个单词。这一任务具有挑战性,因为需要同时保留背景和文本的风格,以确保编辑后的图像在视觉上与源图像无法区分。具体而言,我们提出了一种端到端可训练的风格保留网络(SRNet),该网络由三个模块组成:文本转换模块、背景修复模块和融合模块。文本转换模块将源图像中的文本内容更改为目标文本,同时保持原有的文本风格。背景修复模块擦除原始文本,并用适当的纹理填充文本区域。融合模块结合前两个模块的信息,生成编辑后的文本图像。据我们所知,这是首次尝试在自然图像中进行单词级别的文本编辑。我们在合成数据集和真实世界数据集(ICDAR 2013)上的实验结果从视觉效果和定量分析两方面充分证实了模块化分解的重要性和必要性。此外,我们还进行了广泛的实验,验证了我们的方法在各种实际应用中的有效性,例如文本图像合成、增强现实(AR)翻译、信息隐藏等。