2달 전
다중 문맥 주의를 활용한 인간 자세 추정
Xiao Chu; Wei Yang; Wanli Ouyang; Cheng Ma; Alan L. Yuille; Xiaogang Wang

초록
본 논문에서는 인간 자세 추정을 위한 엔드투엔드 프레임워크에 컨볼루션 신경망과 다중 컨텍스트 어텐션 메커니즘을 통합하는 방법을 제안합니다. 우리는 스택된 아워글래스 네트워크를 채택하여 다양한 의미를 가진 여러 해상도의 특징으로부터 어텐션 맵을 생성합니다. 조건부 랜덤 필드(CRF)는 어텐션 맵에서 인접 영역 간의 상관관계를 모델링하는 데 사용됩니다. 또한, 전체적인 일관성을 중점으로 두는 홀리스틱 어텐션 모델과 각 부위의 세부 설명에 초점을 맞추는 신체 부위 어텐션 모델을 결합하였습니다. 따라서 우리의 모델은 로컬 주요 영역에서 전역적으로 의미론적으로 일관된 공간까지 다른 수준의 세밀함에 집중할 수 있는 능력을 갖추고 있습니다. 또한, 네트워크의 수용 영역을 확장하기 위해 새로운 아워글래스 잔차 유닛(HRUs)을 설계하였습니다. 이 유닛들은 더 큰 수용 영역을 가진 필터가 포함된 사이드 브랜치를 통해 잔차 유닛의 확장을 의미하며, HRUs 내에서 다양한 크기의 특징이 학습되고 결합됩니다. 제안된 다중 컨텍스트 어텐션 메커니즘과 아워글래스 잔차 유닛의 효과성은 두 개의 널리 사용되는 인간 자세 추정 벤치마크에서 평가되었습니다. 우리의 접근법은 모든 신체 부위에서 두 벤치마크 모두 기존 모든 방법보다 우수한 성능을 보였습니다.