17日前
MAMeデータセット:高解像度および可変形状画像特性の重要性について
Ferran Parés, Anna Arias-Duart, Dario Garcia-Gasulla, Gema Campo-Francés, Nina Viladrich, Eduard Ayguadé, Jesús Labarta

要約
画像分類タスクにおいて、最も一般的なアプローチは、データセット内のすべての画像を一意の形状にリサイズし、同時に計算のスケーラビリティを高めるために精度を低くすることである。この手法は計算上の利点を持つが、情報の損失や画像の歪みといった負の副作用により、性能に悪影響を及ぼすことがある。本研究では、極めて高解像度かつ形状が可変であるという特徴を持つ画像分類データセット「MAMe」を紹介する。MAMeの目的は、画像分類におけるこれらの特徴がもたらす影響を検討するためのツールを提供するとともに、関連分野における研究を促進することにある。MAMeデータセットには、3つの美術館から収集された数千点の美術作品が含まれており、アート専門家による監督のもと、29種類の表現媒体(素材および技法)を識別する分類タスクを提案している。現在の画像分類タスクの文脈においてMAMeの特異性を検討した上で、タスクの詳細とデータセットの統計情報を詳述する。さらに、高解像度画像の使用、形状の可変性の活用、および両者の併用が分類性能に与える影響を評価する実験を実施した。結果から、高解像度画像を用いることで性能が向上することが明らかになった一方で、形状の可変性を有効に活用するための手法は依然として不足していることが指摘された。追加の実験により、MAMeデータセットと代表的なImageNetデータセットとの間の本質的な差異が明らかになった。最後に、説明可能性手法と専門家の知見を用いてベースラインモデルを検証し、今後の課題についての洞察を得た。