2 个月前
ImageNet 预训练在历史文档图像分析中的全面研究
Linda Studer; Michele Alberti; Vinaychandran Pondenkandath; Pinar Goktepe; Thomas Kolonko; Andreas Fischer; Marcus Liwicki; Rolf Ingold

摘要
自动分析扫描的历史文档涉及广泛的图像分析任务,这些任务由于缺乏人工标注的学习样本而对机器学习构成了挑战。随着深度神经网络的发展,一种应对训练数据不足的有前景的方法是在不同领域的图像上预训练模型,然后在历史文档上进行微调。当前研究中,跨域迁移学习的一个典型例子是使用在ImageNet数据库上预训练的神经网络进行物体识别。然而,关于这种预训练是否有助于分析具有根本不同图像属性的历史文档,仍是一个 largely open(大部分未解决)的问题。本文中,我们对ImageNet预训练在多种历史文档分析任务中的效果进行了全面的实证调查,包括字符识别、风格分类、手稿年代测定、语义分割和基于内容的检索。尽管我们在像素级语义分割方面获得了混合结果,但在不同的网络架构中观察到一个明显的趋势:ImageNet预训练对分类和基于内容的检索具有积极影响。