AGRNet: 얼굴 분할을 위한 적응형 그래프 표현 학습 및 추론

얼굴 파싱은 각 얼굴 구성 요소에 대해 픽셀 단위의 레이블을 추론하는 작업으로, 최근 많은 주목을 받고 있다. 기존의 방법들은 얼굴 파싱에서 성공적인 결과를 보여주었지만, 얼굴 구성 요소 간의 상관관계를 간과하는 경향이 있었다. 실질적으로, 구성 요소 간의 관계는 얼굴 영역 내 모호한 픽셀을 구분하는 데 핵심적인 단서가 된다. 이 문제를 해결하기 위해, 본 연구에서는 얼굴 구성 요소 간의 관계를 적응형 그래프 표현 학습 및 추론을 통해 모델링하는 방법을 제안한다. 이는 각 구성 요소를 잘 설명하는 대표적인 정점(verteces)을 학습하고, 구성 요소 간의 관계를 활용함으로써 모호성에 대응하는 정확한 파싱 결과를 도출하는 것을 목표로 한다. 특히, 예측된 파싱 맵을 초기 조건으로 하여 픽셀-정점 투영을 기반으로 한 적응형이고 미분 가능한 그래프 추상화 방법을 설계하였다. 이 방법은 특정 얼굴 영역 내의 픽셀 특징을 하나의 정점에 집계함으로써 구성 요소를 그래프 상에 표현한다. 또한 모델 내부에 이미지 에지 정보를 사전 지식(prior)으로 명시적으로 통합하여, 투영 과정에서 에지 픽셀과 비에지 픽셀을 더 잘 구분할 수 있도록 하였으며, 이로 인해 에지 주변의 파싱 결과가 더욱 정교해진다. 이후, 그래프 상의 정점 간 정보 전파를 통해 구성 요소 간의 관계를 학습하고 추론한다. 마지막으로, 개선된 정점 특징을 다시 픽셀 격자로 투영하여 최종 파싱 맵을 예측한다. 모델을 훈련하기 위해, 특징 공간 내 정점 간의 거리가 작아지는 것을 방지하기 위한 판별적 손실(discriminative loss)을 제안하였으며, 이는 의미가 강하고 구분력 있는 정점을 학습하도록 유도한다. 실험 결과, 제안한 모델은 여러 얼굴 파싱 데이터셋에서 우수한 성능을 보였으며, 인간 파싱(task)에 대한 검증을 통해 본 모델의 일반화 능력도 입증하였다.