2달 전

DeepGRU: 깊은 제스처 인식 유틸리티

Mehran Maghoumi; Joseph J. LaViola Jr
DeepGRU: 깊은 제스처 인식 유틸리티
초록

우리는 최근 딥 러닝의 발전을 바탕으로 제스처와 행동 인식을 위한 새로운 엔드투엔드 딥 네트워크 모델인 DeepGRU를 제안합니다. 이 모델은 간결하고 기기 독립적입니다. DeepGRU는 원시 스켈레톤, 포즈 또는 벡터 데이터만 사용하며, 이해하기 쉽고 구현 및 학습이 빠르지만, 어려운 데이터셋에서 최신 성능을 달성합니다. 우리의 방법의 핵심은 스택된 게이트 순환 유닛(GRU) 집합, 두 개의 완전 연결 계층 그리고 새로운 글로벌 어텐션 모델입니다. 우리는 공개된 일곱 개의 데이터셋에서 우리의 방법을 평가하였는데, 이들 데이터셋은 다양한 샘플 수와 광범위한 상호작용(전신, 다중 연기자, 손 제스처 등)을 포함하고 있습니다. 일곱 개 중 하나를 제외한 모든 경우에서 우리는 최신 포즈 기반 방법들을 능가하였습니다. 예를 들어, NTU RGB+D 데이터셋의 크로스-서브젝트 테스트에서는 84.9%의 인식 정확도를, 크로스-뷰 테스트에서는 92.3%의 인식 정확도를 달성하였으며, UT-Kinect 데이터셋에서는 100%의 인식 정확도를 기록하였습니다. DeepGRU는 많은 훈련 샘플을 가진 대규모 데이터셋에서 잘 작동하지만, 훈련 샘플 수가 적더라도 클래스당 최소 4개의 샘플로 전통적인 소규모 훈련 세트에 특화된 방법들을 능가할 수 있음을 보였습니다. 마지막으로, 강력한 하드웨어 없이 CPU만 사용하여도 소규모 데이터셋에서 10분 미만으로 학습될 수 있음을 입증하였습니다. 이는 빠른 애플리케이션 프로토타입과 개발에 매력적인 선택임을 의미합니다.

DeepGRU: 깊은 제스처 인식 유틸리티 | 최신 연구 논문 | HyperAI초신경