
초록
인간의 행동은 관절이 연결된 체부의 움직임 또는 `제스처'로 구성됩니다. 인간의 골격은 직관적으로 관절을 노드로, 그 사이의 자연스러운 연결을 엣지로 하는 희소 그래프로 표현될 수 있습니다. 그래프 컨볼루션 네트워크는 골격 비디오에서 행동을 인식하는 데 사용되어 왔습니다. 우리는 Deformable Part-based Models (DPMs)에서 영감을 받아 이 작업을 위해 부분 기반 그래프 컨볼루션 네트워크 (PB-GCN)를 소개합니다. 우리는 골격 그래프를 서로 관절을 공유하는 네 개의 서브그래프로 나누고, 부분 기반 그래프 컨볼루션 네트워크를 사용하여 인식 모델을 학습합니다. 우리는 이러한 모델이 전체 골격 그래프를 사용하는 모델에 비해 인식 성능이 향상됨을 보여줍니다. 3D 관절 좌표를 노드 특성으로 사용하는 대신, 상대 좌표와 시간적 변위를 사용하면 성능이 더욱 향상됨을 입증하였습니다. 우리의 모델은 NTURGB+D와 HDM05라는 두 가지 도전적인 벤치마크 데이터셋에서 골격 행동 인식 분야에서 최고 수준의 성능을 달성하였습니다.