2 个月前
DeepFont:从图像中识别字体
Wang, Zhangyang ; Yang, Jianchao ; Jin, Hailin ; Shechtman, Eli ; Agarwala, Aseem ; Brandt, Jonathan ; Huang, Thomas S.

摘要
作为核心设计概念之一,从图像或照片中自动识别字体并提供相似字体建议一直是许多设计师的愿望。我们研究了视觉字体识别(VFR)问题,并通过开发DeepFont系统显著推进了该领域的技术水平。首先,我们构建了首个可用的大规模VFR数据集,命名为AdobeVFR,该数据集包含标记的合成数据和部分标记的真实世界数据。其次,为了解决训练数据和测试数据之间的域不匹配问题,我们引入了一种基于堆叠卷积自编码器(SCAE)的卷积神经网络(CNN)分解方法,利用大量未标记的真实世界文本图像与经过特定预处理的合成数据相结合。此外,我们还研究了一种新的基于学习的模型压缩方法,旨在减少DeepFont模型的大小而不牺牲其性能。DeepFont系统在我们收集的数据集上实现了超过80%(前五名)的准确率,并且还生成了一个良好的字体相似度度量,用于字体选择和建议。我们还实现了大约6倍的模型压缩,而没有明显的识别准确率损失。