2 个月前
标注、切割、分组:一种高效的中世纪手稿文本行分割方法
Michele Alberti; Lars Vögtlin; Vinaychandran Pondenkandath; Mathias Seuret; Rolf Ingold; Marcus Liwicki

摘要
本文介绍了一种新的文本行提取方法,通过整合基于深度学习的预分类和最先进的分割技术实现。在复杂的手写文档中进行文本行提取对现代计算机视觉算法来说仍是一个重大挑战。历史手稿尤其是一类难以处理的文档,因为它们存在多种形式的噪声,如退化、透印、间行注释和复杂的手写体。在这项工作中,我们提出了一种新颖的方法,该方法首先使用像素级语义分割作为中间任务,然后进行文本行提取步骤。我们在一个最近发布的具有挑战性的中世纪手稿数据集上测试了该方法的性能,并通过减少80.7%的错误率超越了现有最佳结果。此外,我们还在其他多种不同书写系统的数据集上验证了该方法的有效性。因此,我们的贡献是双重的。首先,我们证明了语义像素分割可以作为强大的去噪预处理步骤,在执行文本行提取之前使用。其次,我们引入了一种新颖、简单且鲁棒的算法,利用高质量的语义分割实现了在具有挑战性的数据集上达到99.42%线交并比(line IU)的文本行提取性能。