
摘要
卷积神经网络(CNNs)在照片中的物体检测性能方面取得了显著提升。然而,关于艺术品中物体检测的研究仍然有限。我们在一个具有挑战性的数据集People-Art上展示了最先进的性能,该数据集包含来自照片、卡通以及41种不同艺术流派的人物图像。我们通过针对此任务微调CNN实现了这一高性能,同时也证明了在照片上训练CNN会导致对照片的过拟合:只有前几层(前三到四层)可以从照片迁移到艺术品。尽管CNN的性能达到了目前的最高水平,但其平均精度(AP)仍低于60%,表明跨描绘问题仍需进一步研究。最终出版物可通过Springer访问,网址为http://dx.doi.org/10.1007/978-3-319-46604-0_57。