BlockGCN: 골격 기반 동작 인식을 위한 토폴로지 인식의 재정의

그래프 컨볼루션 네트워크(GCNs)는 인간 관절의 복잡한 위상 구조를 그래프의 인접 행렬을 통해 해석할 수 있는 능력을 활용하여, 골격 기반 동작 인식 분야에서 오랫동안 최고의 성능을 기록해왔다. 그러나 이러한 최첨단 모델들에 내재된 본질적인 결함이 드러나고 있다. 즉, 모델 가중치와 함께 인접 행렬을 동시에 최적화하는 경향이 있으며, 이 과정은 표면적으로는 효율적으로 보일 수 있지만, 점차 뼈 연결 정보가 훼손되는 결과를 초래한다. 이로 인해 모델은 본래 표현하고자 했던 위상 구조에 무관심해지는 문제가 발생한다. 이를 해결하기 위해 우리는 두 가지 전략을 제안한다. (1) 먼저, 물리적 위상 구조를 설명하는 그래프 거리의 힘을 활용하여 뼈의 연결성을 효과적으로 인코딩하는 혁신적인 접근 방식을 도입한다. 또한, 지속적 호몰로지 분석을 통해 동작 특화 위상 표현을 추가함으로써 체계적 동역학을 정밀하게 묘사한다. 이를 통해 기존 GCN에서 흔히 소실되는 중요한 위상적 특징을 유지할 수 있다. (2) 또한 본 연구는 기존 GCN 모델들이 다중 관계 모델링에서 중복성을 지닌다는 점을 발견하고, 이를 해결하기 위해 그래프 컨볼루션(GC)에 대한 효율적인 개선 방안인 BlockGC를 제안한다. 이는 기존 GCN보다 훨씬 적은 파라미터로 성능을 향상시킨다. 전체 모델인 BlockGCN은 모든 모델 범주에서 골격 기반 동작 인식 분야에 새로운 기준을 제시하였다. 특히 대규모 NTU RGB+D 120 데이터셋에서 높은 정확도와 가벼운 설계로 인해 BlockGCN의 효과성에 대한 강력한 검증이 이루어졌다.