2달 전
GaitMixer: 광범위한 다축 믹서를 통한 골격 기반 보행 표현 학습
Pinyoanuntapong, Ekkasit ; Ali, Ayman ; Wang, Pu ; Lee, Minwoo ; Chen, Chen

초록
대부분의 기존 보행 인식 방법은 외관 기반으로, 사람의 보행 활동을 촬영한 비디오 데이터에서 추출된 실루엣에 의존합니다. 아직 충분히 연구되지 않은 골격 기반 보행 인식 방법은 2D/3D 인간 골격 시퀀스에서 직접 보행 동역학을 학습하며, 이론적으로 옷, 헤어스타일, 소지품 등으로 인한 외관 변화가 있는 경우 더 견고한 해결책이 될 수 있습니다. 그러나 골격 기반 해결책의 성능은 여전히 외관 기반 방법들보다 크게 뒤처져 있습니다. 본 논문에서는 이러한 성능 차이를 줄이기 위해 새로운 네트워크 모델인 GaitMixer를 제안하여 골격 시퀀스 데이터에서 더 구별력 있는 보행 표현을 학습하고자 합니다. 특히 GaitMixer는 이종다축 믹서 아키텍처를 따르며, 공간 자기 주의력 믹서와 시간적 대형 커널 컨볼루션 믹서를 결합하여 보행 특징 맵에서 다양한 주파수 신호를 학습합니다. 일반적으로 사용되는 보행 데이터베이스인 CASIA-B에서 수행된 실험 결과, GaitMixer는 이전 최고 수준의 골격 기반 방법들을 크게 능가하면서도 대표적인 외관 기반 해결책들과 비교해 경쟁력 있는 성능을 달성하는 것으로 나타났습니다. 코드는 https://github.com/exitudio/gaitmixer 에서 제공될 예정입니다.