2달 전

노이즈 라벨을 사용한 깊은 얼굴 표현을 위한 경량 CNN

Wu, Xiang ; He, Ran ; Sun, Zhenan ; Tan, Tieniu
노이즈 라벨을 사용한 깊은 얼굴 표현을 위한 경량 CNN
초록

얼굴 인식을 위해 제안된 컨벌루션 신경망(CNN) 모델의 규모는 대규모 학습 데이터를 더 잘 적합시키기 위해 지속적으로 확대되고 있습니다. 인터넷에서 학습 데이터를 수집할 때, 라벨은 불명확하고 부정확할 가능성이 높습니다. 본 논문에서는 대규모 얼굴 데이터와 많은 노이즈가 포함된 라벨을 사용하여 컴팩트한 임베딩을 학습하는 Light CNN 프레임워크를 제시합니다.첫째, CNN의 각 컨벌루션 계층에 최대 출력 활성화(maxout activation)의 변형인 최대 특징 맵(Max-Feature-Map, MFM)을 도입합니다. 일반적인 최대 출력 활성화가 여러 특징 맵을 사용하여 임의의 볼록 활성화 함수를 선형으로 근사하는 것과 달리, MFM은 경쟁 관계를 통해 이를 수행합니다. MFM은 노이즈와 정보가 있는 신호를 분리할 수 있을 뿐만 아니라 두 개의 특징 맵 간의 특징 선택 역할도 수행합니다.둘째, 성능 향상과 동시에 매개변수와 계산 비용을 줄이기 위해 세 가지 네트워크가 주의 깊게 설계되었습니다. 마지막으로, 의미 부트스트래핑(semantic bootstrapping) 방법이 제안되어 네트워크의 예측 결과가 노이즈가 포함된 라벨과 더욱 일관되도록 만듭니다. 실험 결과, 제안된 프레임워크는 대규모 노이즈 데이터를 활용하여 계산 비용과 저장 공간 면에서 효율적인 Light 모델을 학습할 수 있음을 보여주었습니다. 256차원 표현을 가진 단일 학습된 네트워크는 미세 조정(fine-tuning) 없이 다양한 얼굴 벤치마크에서 최고 수준의 결과를 달성했습니다. 코드는 https://github.com/AlfredXiangWu/LightCNN 에 공개되었습니다.

노이즈 라벨을 사용한 깊은 얼굴 표현을 위한 경량 CNN | 최신 연구 논문 | HyperAI초신경