2달 전

양자화된 밀집 연결 U-Net을 이용한 효율적인 랜드마크 위치 결정

Zhiqiang Tang; Xi Peng; Shijie Geng; Lingfei Wu; Shaoting Zhang; Dimitris Metaxas
양자화된 밀집 연결 U-Net을 이용한 효율적인 랜드마크 위치 결정
초록

본 논문에서는 효율적인 시각적 랜드마크 위치 결정을 위해 양자화된 밀집 연결 U-Net을 제안합니다. 이 아이디어는 동일한 의미론적 특성이 스택된 U-Net 전체에서 전역적으로 재사용되는 것입니다. 이러한 밀집 연결은 정보 흐름을 크게 개선하여 위치 결정 정확도를 향상시킵니다. 그러나 기본적인 밀집 설계는 학습과 테스트 과정에서 중요한 효율성 문제를 겪게 됩니다. 이 문제를 해결하기 위해, 먼저 K차수 밀집 연결(Order-K dense connectivity)을 제안하여 장거리 단축 경로를 제거합니다. 그 다음, 메모리 효율적인 구현 방법을 사용하여 학습 효율성을 크게 향상시키고, 모델 크기를 절반으로 줄일 수 있는 반복적인 정교화(iterative refinement)를 조사합니다. 마지막으로, 학습과 테스트 과정에서의 메모리 소비와 고정밀 연산을 줄이기 위해, 위치 결정 네트워크의 가중치, 입력값, 그리고 그래디언트를 저 비트폭 숫자로 양자화합니다.우리는 이 접근법을 두 가지 작업에 검증하였습니다: 인간 자세 추정(human pose estimation)과 얼굴 정렬(face alignment). 결과는 본 접근법이 다른 벤치마크 위치 결정기와 비교하여 ~70% 적은 매개변수, ~98% 작은 모델 크기, 그리고 ~75%의 학습 메모리를 절약하면서 최고 수준의 위치 결정 정확도를 달성함을 보여줍니다. 코드는 https://github.com/zhiqiangdon/CU-Net에서 제공됩니다.