일반 부분 레이블 학습을 위한 이중 이분 그래프 오토인코더

우리는 실용적이면서도 도전적인 문제를 제안한다: 일반 부분 레이블 학습(General Partial Label Learning, GPLL). 기존의 부분 레이블 학습(Partial Label Learning, PLL) 문제와 비교할 때, GPLL은 인스턴스 수준의 supervision 가정을 완화하여 그룹 수준으로 확장한다. 구체적으로, 1) 레이블 집합이 여러 인스턴스로 구성된 그룹을 부분적으로 레이블링하며, 그룹 내 인스턴스와 레이블 간의 연결 정보는 누락되어 있으며, 2) 그룹 간 연결이 허용된다 — 즉, 한 그룹의 인스턴스가 다른 그룹의 레이블 집합과 부분적으로 연결될 수 있다. 이러한 모호한 그룹 수준의 supervision은 실제 환경에서 더 현실적이며, 인스턴스 수준의 추가 레이블링이 더 이상 필요하지 않다. 예를 들어, 비디오 내 얼굴 이름 지정(예: 프레임 내 얼굴 집합이 해당 프레임의 캡션에 제시된 이름 집합으로 부분적으로 레이블링됨)과 같은 상황에서 이러한 접근이 유용하다. 본 논문에서는 GPLL의 레이블 모호성 문제를 해결하기 위해 새로운 그래프 컨볼루션 네트워크(GCN)인 이중 이분 그래프 오토에인코더(Dual Bipartite Graph Autoencoder, DB-GAE)를 제안한다. 먼저, 그룹 간 상관관계를 활용하여 인스턴스 그룹을 이중 이분 그래프로 표현한다. 즉, 그룹 내 연결과 그룹 간 연결을 각각 모델링하며, 이 두 그래프는 서로 보완적으로 작용하여 연결의 모호성을 해소한다. 둘째, 이러한 그래프 구조를 인코딩하고 디코딩하기 위한 GCN 오토에인코더를 설계한다. 디코딩 결과는 개선된 최종 예측으로 간주된다. 특히 DB-GAE는 오프라인 사전 학습 단계 없이 그룹 수준의 supervision만을 사용하는 자기지도 학습(self-supervised) 및 전도적(transductive) 방식임을 특징으로 한다. 두 개의 실세계 데이터셋에 대한 광범위한 실험 결과는 DB-GAE가 최고의 기준 모델보다 절대적으로 F1 점수에서 0.159 포인트, 정확도에서 24.8% 향상됨을 보여준다. 또한, 다양한 수준의 레이블 모호성에 대한 심층적인 분석을 제시한다.