17 天前
基于动态实例生成与局部阈值化的少样本像素级文档版面分割
{Gian Luca Foresti, Emanuela Colombi, Claudio Piciarelli, Silvia Zottin, Axel De Nardin}
摘要
多年来,人文学界日益呼吁构建人工智能框架,以助力文化遗产研究。文档版面分割(Document Layout Segmentation)作为该趋势中的一个关键任务,尤其在手写文本研究中具有重要意义。该任务旨在识别文档页面中的各类结构化组件。尽管目前已提出多种高效的方法,但这些方法普遍依赖大规模标注数据来训练模型,而在实际应用中,此类数据的获取往往极为困难。这是因为达到像素级精度的标注工作耗时极长,且通常需要对特定文档类型具备一定的领域知识。针对这一挑战,本文提出了一种基于两项创新组件的高效少样本学习框架,分别为动态实例生成机制与分割结果优化模块。该方法在主流的Diva-HisDB数据集上取得了与当前最先进水平相当的性能,同时仅需使用极少量的训练数据。