무작위 기울기 임계값을 통한 신속한 주의도 안내 믹스업

Mix-up 훈련 방법론은 딥 뉴럴 네트워크의 일반화 능력을 향상시키는 데 효과적임이 입증되었습니다. 수년 동안 연구 커뮤니티는 mix-up 방법을 두 가지 방향으로 확장해 왔으며, 주로 특성지도(saliency) 기반 절차를 개선하는 데 중점을 두었지만 임의 경로(arbitrary path)에는 거의 주목하지 않았습니다. 이 논문에서는 각 방향의 우수한 특성을 서로 보완적으로 활용하여 두 경로의 교차점에 위치한 새로운 방법론을 제시합니다. 무작위성과 특성지도 활용의 최고 요소를 결합하여, 우리의 방법론은 속도, 단순성, 정확성을 균형 있게 유지합니다. 우리는 이 방법론을 "무작위 믹스업(Random Mix-up)"이라는 개념에 따라 R-Mix라고 명명하였습니다. 일반화, 약간 감독된 객체 위치 추정(weakly supervised object localization), 캘리브레이션, 대립적 공격(adversarial attacks)에 대한 강건성에서 그 효과를 입증하였습니다. 마지막으로, 더 나은 결정 프로토콜이 존재하는지 여부에 대한 질문을 해결하기 위해 분류기의 성능을 기반으로 mix-up 정책을 결정하는 강화 학습(RL) 에이전트를 훈련시켰습니다. 이는 인간이 설계한 목적 함수와 하이퍼파라미터 조정에 대한 의존성을 줄이는 것을 목표로 합니다. 광범위한 실험 결과는 에이전트가 최첨단 수준에서 수행할 수 있음을 보여주며, 완전 자동화된 mix-up의 기초를 마련하였습니다. 우리의 코드는 [https://github.com/minhlong94/Random-Mixup]에서 제공됩니다.