
摘要
尽管深度学习神经网络在目标检测领域取得了显著进展,这些模型在识别艺术图像(如绘画和素描)中的物体时仍面临挑战。这一难题被称为“跨表现形式问题”(cross depiction problem),其部分原因在于神经网络倾向于优先关注物体的纹理特征,而非其形状结构。本文提出并评估了一种训练神经网络以定位艺术图像中目标(特别是人物)的流程。我们通过使用AdaIn风格迁移技术对COCO数据集中的图像进行修改,构建了一个大规模的训练与验证数据集。该数据集用于微调Faster R-CNN目标检测网络,随后在现有的People-Art测试数据集上进行评估。实验结果表明,该方法显著超越了当前最先进的性能水平,并为未来构建用于训练神经网络处理艺术图像的数据集提供了新的可行路径。