2달 전

무료로 대적 훈련하기!

Ali Shafahi; Mahyar Najibi; Amin Ghiasi; Zheng Xu; John Dickerson; Christoph Studer; Larry S. Davis; Gavin Taylor; Tom Goldstein
무료로 대적 훈련하기!
초록

적대적 훈련은 네트워크가 적대적 예제를 통해 훈련되는 방식으로, 강력한 적대적 공격에 대항할 수 있는 몇 안 되는 방어 방법 중 하나입니다. 그러나 강력한 적대적 예제를 생성하는 높은 비용 때문에 표준 적대적 훈련은 ImageNet과 같은 대규모 문제에서는 실용적이지 않습니다. 우리는 모델 매개변수를 업데이트할 때 계산된 그래디언트 정보를 재사용하여 적대적 예제 생성의 부담을 제거하는 알고리즘을 제시합니다. 우리의 "무료" 적대적 훈련 알고리즘은 자연 훈련에 비해 거의 추가적인 비용 없이 CIFAR-10 및 CIFAR-100 데이터셋에서 PGD(PGD: Projected Gradient Descent) 적대적 훈련과 유사한 견고성을 달성하며, 다른 강력한 적대적 훈련 방법보다 7배에서 30배 더 빠릅니다. 4개의 P100 GPU와 2일간의 실행 시간을 갖춘 단일 워크스테이션을 사용하여, PGD 공격에 대해 40%의 정확도를 유지하는 대규모 ImageNet 분류 작업을 위한 견고한 모델을 훈련시킬 수 있습니다. 코드는 https://github.com/ashafahi/free_adv_train에서 제공됩니다.