이중 그래프 컨볼루션 네트워크를 이용한 의미 분할

픽셀 단위 예측 작업, 예를 들어 의미 분할(semantic segmentation)에서 장거리 맥락 정보를 효과적으로 활용하는 것은 매우 중요하다. 기존의 다중 스케일 특징 융합 또는 확장된 컨볼루션(dilated convolutions) 방식과는 달리, 본 연구에서는 이 문제를 해결하기 위해 새로운 그래프 컨볼루션 네트워크(GCN)를 제안한다. 제안하는 이중 그래프 컨볼루션 네트워크(Dual Graph Convolutional Network, DGCNet)는 단일 프레임워크 내에서 두 개의 직교적 그래프(orthogonal graphs)를 모델링함으로써 입력 특징의 전역 맥락을 효과적으로 표현한다. 첫 번째 구성 요소는 이미지 내 픽셀 간의 공간적 관계를 모델링하고, 두 번째 구성 요소는 네트워크의 특징 맵(channel dimension)에 따른 상호의존성(interdependencies)을 표현한다. 이러한 모델링은 특징을 더 낮은 차원의 새로운 공간으로 투영하여 모든 쌍 간의 상호작용을 효율적으로 표현한 후, 원래 공간으로 재투영함으로써 수행된다. 제안하는 간단한 방법은 강력한 기준 모델에 비해 상당한 성능 향상을 제공하며, Cityscapes(82.0% 평균 IoU) 및 Pascal Context(53.7% 평균 IoU) 데이터셋에서 최신 기술 수준(state-of-the-art)의 성과를 달성하였다. 코드와 모델은 향후 연구를 촉진하기 위해 공개되며, GitHub 링크를 통해 접근 가능하다(\url{https://github.com/lxtGH/GALD-DGCNet}).