2 个月前
U-DIADS-Bib:古代手稿文档布局分析的全样本和少样本像素级数据集
Zottin, Silvia ; De Nardin, Axel ; Colombi, Emanuela ; Piciarelli, Claudio ; Pavan, Filippo ; Foresti, Gian Luca

摘要
文档布局分析是指识别文档页面中不同语义区域的任务,对于计算机科学家和人文学者来说都是一个非常重要的研究课题。对于前者而言,这是进一步分析任务的基础步骤;而对于后者,则是一种强大的工具,可以改进并促进文档的研究。然而,目前文献中的许多工作,尤其是在可用数据集方面,未能满足两个领域的实际需求,特别是倾向于满足计算机科学的需求和常见做法,导致这些资源不能真实反映人文领域的需求。因此,本文介绍了U-DIADS-Bib,这是一个由计算机视觉和人文领域的专家密切合作开发的新型、像素级精确、无重叠且无噪声的文档布局分析数据集。此外,我们提出了一种新的计算机辅助分割流程,旨在减轻手动注释这一耗时过程所带来的负担,而手动注释是生成地面真值分割图所必需的。最后,我们介绍了一个标准化的小样本版本数据集(U-DIADS-BibFS),其目的是鼓励开发能够以尽可能少的样本解决此任务的模型和解决方案,从而在现实场景中实现更有效的应用,在这些场景中收集大量分割样本并不总是可行的。