
초록
신경망은 인위적으로 설계된 적대적 편향( adversarial perturbations)에 취약하다. 최근의 연구들은 분류층에 특정한 수정을 가함으로써 신경망의 강건성(robustness)을 향상시킬 수 있음을 보여주었다. 본 논문에서는 원소의 크기가 동일한 밀집된 직교 가중치 행렬( dense orthogonal weight matrix)을 명시적으로 구성함으로써, 새로운 강건한 분류기(robust classifier)를 제안한다. 제안하는 분류기는 기존 연구에서 발생하던 바람직하지 않은 구조적 중복 문제를 피할 수 있다. 정상 데이터에서 표준적인 학습 과정에 이 분류기를 적용하는 것만으로도 모델의 높은 정확도와 양호한 강건성을 보장할 수 있다. 또한, 추가적인 적대적 샘플을 활용할 경우, 특별한 최악의 경우 손실 함수(worst-case loss)를 도입함으로써 더욱 향상된 강건성을 달성할 수 있다. 실험 결과는 제안한 방법이 많은 최첨단 방어 기법들과 경쟁력 있고 효율적임을 보여준다. 본 연구의 코드는 \url{https://github.com/MTandHJ/roboc} 에 공개되어 있다.