한 달 전
sembantic 그래프 컨볼루션 네트워크를 이용한 3차원 인간 포즈 회귀
Long Zhao; Xi Peng; Yu Tian; Mubbasir Kapadia; Dimitris N. Metaxas

초록
본 논문에서는 그래프 구조화 데이터를 위한 회귀 작업에 Graph Convolutional Networks (GCNs)를 학습하는 문제를 연구합니다. 현재의 GCN 아키텍처는 컨벌루션 필터의 작은 수용 범위와 각 노드에 대한 공유 변환 행렬에 제한되어 있습니다. 이러한 한계를 극복하기 위해, 우리는 그래프 구조화 데이터에서 회귀 작업을 수행하는 새로운 신경망 아키텍처인 Semantic Graph Convolutional Networks (SemGCN)을 제안합니다. SemGCN은 그래프에 명시적으로 표현되지 않은 로컬 및 글로벌 노드 관계와 같은 의미 정보를 학습하여 포착합니다. 이러한 의미적 관계는 추가적인 감독이나 수작업 규칙 없이 지도 데이터로부터 엔드투엔드(end-to-end)로 학습될 수 있습니다. 또한, 우리는 SemGCN을 3D 인간 자세 회귀에 적용하는 것을 탐구하였습니다. 우리의 공식화는 직관적이며 충분한데, 이는 2D와 3D 인간 자세 모두가 인간 체골의 관절 간 관계를 인코딩하는 구조화된 그래프로 표현될 수 있기 때문입니다. 우리는 우리 방법의 유효성을 검증하기 위해 종합적인 연구를 수행하였습니다. 결과는 SemGCN이 기존 최고 성능 모델보다 우수하면서도 90% 적은 매개변수를 사용한다는 것을 증명하였습니다.