2 个月前
基于领域内迁移学习和深度卷积神经网络堆叠泛化的文档图像分类
Arindam Das; Saikat Roy; Ujjwal Bhattacharya; Swapan Kumar Parui

摘要
在本研究中,提出了一种基于区域的深度卷积神经网络框架,用于文档结构学习。本研究的主要贡献在于高效训练基于区域的分类器以及有效地进行文档图像分类的集成。首先,通过从在ImageNet数据集上预训练的VGG16架构导出权重,利用跨域(inter-domain)迁移学习对整个文档图像的文档分类器进行训练。其次,利用基于区域的影响建模特性,采用域内(intra-domain)迁移学习快速训练深度学习模型以处理图像片段。最后,通过堆叠泛化集成方法将基础深度神经网络模型的预测结果进行整合。所提出的这种方法在流行的RVL-CDIP文档图像数据集上达到了92.2%的最先进准确率,超过了现有算法设定的基准。