
초록
그래프 컨볼루션 네트워크(GCN)는 골격 기반 동작 인식에서 널리 활용되고 있다. 기존의 GCN 기반 접근법은 주로 사전 정의된 그래픽 구조(즉, 골격 관절의 수동적으로 정의된 연결 구조)에 의존하고 있으며, 이는 관절 간의 복잡한 상관관계를 포착하는 데 유연성을 제한한다. 이러한 제약을 극복하기 위해, 우리는 골격 기반 동작 인식을 위한 새로운 프레임워크인 동적 그룹 공간-시간 GCN(DG-STGCN)을 제안한다. 이 프레임워크는 공간 모델링을 위한 DG-GCN과 시간 모델링을 위한 DG-TCN이라는 두 가지 모듈로 구성된다. 특히 DG-GCN은 사전 정의된 그래픽 구조에 의존하지 않고, 학습된 유사도 행렬을 활용하여 동적 그래픽 구조를 추출한다. 반면 DG-TCN은 다양한 수용 영역을 갖는 그룹 단위 시간 컨볼루션을 수행하며, 적응형 다중 수준 시간 모델링을 위해 동적 관절-골격 융합 모듈을 도입한다. NTURGB+D, Kinetics-Skeleton, BABEL, Toyota SmartHome 등 다양한 벤치마크에서 DG-STGCN은 기존 최고 수준의 방법들을 일관되게 상회하며, 때로는 두드러진 성능 차이를 보였다.