16일 전

신경망의 적대적 저항성 향상을 위한 수직 분류기

Cong Xu, Xiang Li, Min Yang
신경망의 적대적 저항성 향상을 위한 수직 분류기
초록

신경망은 인위적으로 설계된 적대적 편향( adversarial perturbations)에 취약하다. 최근의 연구들은 분류층에 특정한 수정을 가함으로써 신경망의 강건성(robustness)을 향상시킬 수 있음을 보여주었다. 본 논문에서는 원소의 크기가 동일한 밀집된 직교 가중치 행렬( dense orthogonal weight matrix)을 명시적으로 구성함으로써, 새로운 강건한 분류기(robust classifier)를 제안한다. 제안하는 분류기는 기존 연구에서 발생하던 바람직하지 않은 구조적 중복 문제를 피할 수 있다. 정상 데이터에서 표준적인 학습 과정에 이 분류기를 적용하는 것만으로도 모델의 높은 정확도와 양호한 강건성을 보장할 수 있다. 또한, 추가적인 적대적 샘플을 활용할 경우, 특별한 최악의 경우 손실 함수(worst-case loss)를 도입함으로써 더욱 향상된 강건성을 달성할 수 있다. 실험 결과는 제안한 방법이 많은 최첨단 방어 기법들과 경쟁력 있고 효율적임을 보여준다. 본 연구의 코드는 \url{https://github.com/MTandHJ/roboc} 에 공개되어 있다.

신경망의 적대적 저항성 향상을 위한 수직 분류기 | 최신 연구 논문 | HyperAI초신경