11일 전

UniformAugment: 검색이 없는 확률적 데이터 증강 방법

Tom Ching LingChen, Ava Khonsari, Amirreza Lashkari, Mina Rafi Nazari, Jaspreet Singh Sambee, Mario A. Nascimento
UniformAugment: 검색이 없는 확률적 데이터 증강 방법
초록

학습 데이터셋의 증강은 여러 컴퓨터 비전 과제에서 학습 효과를 향상시킨다는 것이 입증되었다. 효과적인 증강은 원본 데이터셋의 통계적 특성을 유지하면서 다양성을 추가하는 증강 데이터셋을 생성해야 한다. 일부 기법, 예를 들어 AutoAugment 및 Fast AutoAugment는 주어진 모델과 데이터셋에 적합한 증강 정책 집합을 탐색하는 단계를 도입하였다. 그러나 이는 막대한 계산적 부담을 수반하며, 최대 수천 시간에 이르는 GPU 연산 시간이 소요된다. 최근에는 RandAugment가 제안되어 몇몇 하이퍼파라미터로 증강 공간을 근사함으로써 탐색 단계를 상당히 가속화하였지만, 여전히 해당 하이퍼파라미터를 튜닝하는 데 있어 무시할 수 없는 비용이 발생한다. 본 논문에서는 증강 공간이 근사적으로 분포 불변(invariant)하다는 가정 하에, 증강 변환의 연속 공간에서 균일한 샘플링만으로도 매우 효과적인 모델을 학습할 수 있음을 보여준다. 이 결과를 바탕으로, 탐색 단계를 완전히 회피할 수 있는 자동 데이터 증강 기법인 UniformAugment를 제안한다. 본 연구에서는 제안한 방법의 이론적 근거를 논의함과 동시에, 표준 데이터셋과 이미지 분류를 위한 기존의 널리 사용되는 모델들을 활용하여, UniformAugment가 앞서 언급된 기법들과 비교해 유사한 성능을 보임을 보여주며, 탐색 과정이 필요하지 않다는 점에서 매우 효율적임을 입증한다.

UniformAugment: 검색이 없는 확률적 데이터 증강 방법 | 최신 연구 논문 | HyperAI초신경