2 个月前

多全局描述符组合用于图像检索

HeeJae Jun; Byungsoo Ko; Youngjoon Kim; Insik Kim; Jongtack Kim
多全局描述符组合用于图像检索
摘要

近期在图像检索任务中的研究表明,组合不同模型和多个全局描述符可以提高性能。然而,为集成模型训练不同的子模型不仅难度大,而且在时间和内存方面效率低下。本文提出了一种新颖的框架,该框架利用多个全局描述符以获得集成效果,同时可以进行端到端训练。所提出的框架具有灵活性和可扩展性,可以通过全局描述符、CNN主干网络、损失函数和数据集进行调整。此外,我们通过定量和定性分析研究了组合多个全局描述符的有效性。大量实验表明,组合描述符优于单一全局描述符,因为它能够利用不同类型特征属性的优势。在基准评估中,所提出的框架在CARS196、CUB200-2011、In-shop Clothes和Stanford Online Products图像检索任务上达到了最先进的性能。我们的模型实现和预训练模型已公开发布。