2달 전
다운샘플링된 ImageNet 변형을 CIFAR 데이터셋의 대안으로 사용
Patryk Chrabaszcz; Ilya Loshchilov; Frank Hutter

초록
원래 ImageNet 데이터셋은 딥 뉴럴 네트워크를 훈련시키는 데 사용되는 인기 있는 대규모 벤치마크입니다. 원본 데이터셋에서 실험을 수행하는 비용(예: 알고리즘 설계, 아키텍처 탐색, 하이퍼파라미터 조정)이 과도할 수 있으므로, 우리는 ImageNet의 축소된 버전을 고려할 것을 제안합니다. CIFAR 데이터셋과 이전의 ImageNet 축소 버전과 달리, 제안하는 ImageNet32×32(그리고 그 변형인 ImageNet64×64와 ImageNet16×16)은 원래 ImageNet과 동일한 클래스와 이미지 수를 포함하며, 유일한 차이점은 이미지가 각각 32×32 픽셀(변형의 경우 64×64 픽셀 및 16×16 픽셀)로 축소되었다는 것입니다. 이러한 축소된 변형에서의 실험은 원래 ImageNet에 비해 극히 빠르게 진행되며, 최적의 하이퍼파라미터에 대한 축소된 데이터셋의 특성은 유사하게 유지되는 것으로 보입니다. 제안하는 데이터셋과 결과 재현을 위한 스크립트는 http://image-net.org/download-images 및 https://github.com/PatrykChrabaszcz/Imagenet32_Scripts에서 이용 가능합니다.