2달 전

2D/3D 포즈 추정 및 행동 인식을 위한 다중 작업 딥 러닝

Diogo C. Luvizon; David Picard; Hedi Tabia
2D/3D 포즈 추정 및 행동 인식을 위한 다중 작업 딥 러닝
초록

행동 인식과 인간 자세 추정은 밀접하게 관련되어 있지만, 문헌에서는 일반적으로 두 문제를 별개의 작업으로 처리합니다. 본 연구에서는 정지 이미지에서 2D 및 3D 자세 추정과 비디오 시퀀스에서 인간 행동 인식을 동시에 수행하는 다중 작업 프레임워크를 제안합니다. 우리는 단일 아키텍처가 두 문제를 효율적으로 해결하면서 여전히 최신 결과를 달성할 수 있음을 보여줍니다. 또한, 끝까지의 최적화(end-to-end optimization)가 분리된 학습보다 훨씬 더 높은 정확도를 제공함을 입증하였습니다. 제안된 아키텍처는 다양한 범주의 데이터를 동시에 원활하게 학습할 수 있습니다. MPII, Human3.6M, Penn Action, NTU 네 가지 데이터셋에서 보고된 결과는 우리의 방법이 목표한 작업에서 효과적임을 증명합니다.

2D/3D 포즈 추정 및 행동 인식을 위한 다중 작업 딥 러닝 | 최신 연구 논문 | HyperAI초신경