17 天前
MAMe数据集:高分辨率与可变形状图像属性的相关性研究
Ferran Parés, Anna Arias-Duart, Dario Garcia-Gasulla, Gema Campo-Francés, Nina Viladrich, Eduard Ayguadé, Jesús Labarta

摘要
在图像分类任务中,最普遍的做法是将数据集中所有图像统一调整为单一尺寸,并降低其精度以适应大规模实验的需求。尽管这一做法在计算效率方面具有优势,但会导致信息丢失和图像形变,从而对模型性能产生负面影响。本文提出MAMe数据集——一个具有显著高分辨率和可变形状特性的图像分类数据集。MAMe旨在为研究此类属性对图像分类性能的影响提供工具,同时推动该领域的研究进展。MAMe数据集包含来自三家不同博物馆的数千件艺术作品,其分类任务要求区分29种不同的艺术媒介(即材料与技法),该任务由艺术专家进行监督标注。在回顾MAMe在当前图像分类任务背景下的独特性后,本文详细描述了该任务,并提供了完整的数据集统计信息。通过一系列实验,评估了使用高分辨率图像、可变形状输入以及二者同时使用对模型性能的影响。实验结果表明,采用高分辨率图像能够显著提升分类性能;然而,当前尚缺乏有效方法充分利用图像的可变形状特性。此外,一项附加实验揭示了MAMe数据集与典型ImageNet数据集之间的显著差异。最后,本文结合可解释性方法与专家知识对基线模型进行了深入分析,以揭示当前仍面临的关键挑战。