AutoAugment: 데이터로부터 증강 전략 학습하기

데이터 증강은 현대 이미지 분류기의 정확도를 향상시키는 효과적인 기법이다. 그러나 현재의 데이터 증강 구현은 수동적으로 설계되고 있다. 본 논문에서는 향상된 데이터 증강 정책을 자동으로 탐색할 수 있는 간단한 절차인 AutoAugment을 제안한다. 본 연구에서 제안한 구현 방식은 정책이 여러 하위 정책(sub-policies)으로 구성되는 검색 공간을 설계한 것으로, 각 미니배치 내의 이미지마다 랜덤으로 하나의 하위 정책이 선택된다. 각 하위 정책은 두 가지 이미지 처리 연산으로 구성되며, 이 연산들은 이동(translation), 회전(rotation), 비틀기(shearing)와 같은 이미지 처리 함수이며, 각 함수가 적용될 확률과 강도(magnitude)를 포함한다. 우리는 타깃 데이터셋에서 신경망이 최고의 검증 정확도를 달성하도록 하기 위해 검색 알고리즘을 사용하여 최적의 정책을 탐색한다. 제안한 방법은 CIFAR-10, CIFAR-100, SVHN, 그리고 ImageNet(추가 데이터 없이)에서 최신 기술 수준의 정확도를 달성한다. 특히 ImageNet에서는 기존 기록인 83.1%보다 0.4% 높은 Top-1 정확도 83.5%를 기록하였다. CIFAR-10에서는 기존 최고 성능보다 0.6% 향상된 오류율 1.5%를 달성하였다. 발견한 증강 정책은 다양한 데이터셋 간에 전이 가능하다. ImageNet에서 학습한 정책은 Oxford Flowers, Caltech-101, Oxford-IIT Pets, FGVC Aircraft, Stanford Cars 등의 다른 데이터셋에서도 효과적으로 전이되어 상당한 성능 향상을 이끌어냈다.