MAMe 데이터셋: 고해상도 및 변형된 형태 이미지 특성의 관련성에 관하여

이미지 분류 과제에서 가장 흔한 접근 방식은 데이터셋 내 모든 이미지를 동일한 크기로 리사이징하고, 실험의 대규모 적용을 용이하게 하기 위해 정밀도를 낮추는 것이다. 이 방법은 계산 측면에서 장점이 있지만, 정보 손실과 이미지 왜곡으로 인해 성능에 부정적인 영향을 미친다. 본 연구에서는 높은 해상도와 다양한 이미지 형태를 갖춘 이미지 분류 데이터셋인 MAMe를 소개한다. MAMe의 목적은 이러한 특성들이 이미지 분류에 미치는 영향을 연구할 수 있는 도구를 제공하고, 관련 분야의 연구를 촉진하는 것이다. MAMe 데이터셋은 세 개의 다른 박물관에서 수집한 수천 점의 예술 작품을 포함하며, 예술 전문가의 감수 아래 29개의 매체(즉, 재료 및 기법)를 구분하는 분류 과제를 제안한다. 현재 이미지 분류 과제의 맥락에서 MAMe의 독창성을 검토한 후, 과제에 대한 철저한 설명과 데이터셋 통계를 제시한다. 고해상도 이미지 사용, 다양한 형태의 입력, 그리고 두 특성을 동시에 사용했을 때의 영향을 평가하기 위한 실험을 수행하였다. 결과는 고해상도 이미지를 사용할 경우 성능 향상이 긍정적으로 나타나는 것을 보여주며, 다양한 형태의 입력을 효과적으로 활용할 수 있는 해결책이 아직 부족함을 강조한다. 추가 실험을 통해 MAMe 데이터셋과 전형적인 ImageNet 데이터셋 간의 차별성을 입증하였다. 마지막으로, 설명 가능성 기법과 전문가 지식을 활용하여 기준 모델(baselines)을 분석함으로써, 앞으로 해결해야 할 과제에 대한 통찰을 도출하였다.