
초록
얼굴 파싱(Face parsing)은 각 얼굴 구성 요소에 대해 픽셀 단위의 레이블을 추론하는 작업으로, 최근 많은 주목을 받고 있다. 기존의 방법들은 얼굴 파싱에서 효율성을 입증했으나, 서로 다른 얼굴 영역 간의 상관관계를 간과하고 있다. 이러한 상관관계는 얼굴의 외형, 자세, 표정 등의 중요한 단서를 제공하며, 얼굴 파싱에 있어 고려되어야 할 핵심 요소이다. 이를 해결하기 위해 우리는 그래프 표현을 학습함으로써 영역 간 관계를 모델링하고 추론하며, 영역 간 엣지 정보를 활용하여 보다 최적화된 특징 추출을 수행하는 방식을 제안한다. 구체적으로, 유사한 특징을 가진 픽셀 집합(“영역”)을 각 정점에 투영하여 얼굴 이미지를 전역적인 그래프 표현으로 인코딩한다. 제안하는 모델은 그래프 상의 정점 간 정보 전파를 통해 영역 간 관계를 학습하고 추론한다. 더불어, 엣지 정보를 활용해 픽셀 단위의 특징을 정점으로 집계함으로써, 엣지 주변의 특징을 강조하여 엣지에 따라 정밀한 분할을 가능하게 한다. 최종적으로 학습된 그래프 표현은 다시 픽셀 격자로 변환되어 얼굴 파싱에 사용된다. 실험 결과, 제안하는 모델은 널리 사용되는 Helen 데이터셋에서 최신 기술 대비 우수한 성능을 보였으며, 대규모의 CelebAMask-HQ 및 LaPa 데이터셋에서도 뛰어난 성능을 나타냈다. 코드는 https://github.com/tegusi/EAGRNet 에 공개되어 있다.