
이 연구에서는 의미 분할을 위한 완전 자율 학습 프레임워크(FS⁴)를 제안한다. 오픈 월드 도메인에서 엔드투엔드로 맞춤형 모델을 구축하기 위해서는 방대한 레이블링 작업을 줄일 수 있는 완전 자율 부트스트랩 전략이 필수적이다. 이러한 응용은 실제 환경에서 매우 절실하게 요구된다. 최근 자율 학습 기반의 의미 분할 기법들은 큰 진전을 이루었지만, 대부분 완전 지도 학습 전처리 모델에 강하게 의존하여 완전 자율 학습 파이프라인을 구현하는 데 한계가 있다. 이 문제를 해결하기 위해 우리는 새로운 부트스트랩 학습 전략을 제안하며, 제안한 PGG 전략과 CAE 모듈을 통해 전역적인 의미 지식을 효과적으로 활용하여 자율 학습을 가능하게 했다. 특히, 분할 지도를 위해 픽셀 클러스터링과 할당을 수행한다. 클러스터링 과정에서 혼란스러운 결과가 발생하는 것을 방지하기 위해, 1) 피라미드-전역 안내(PGG) 학습 전략을 도입하여 피라미드 구조의 이미지/패치 수준의 가상 레이블을 활용해 학습을 안내한다. 이 가상 레이블은 비지도 특징을 그룹화하여 생성되며, 안정적인 전역 및 피라미드 수준의 의미적 가상 레이블은 분할 결과가 과도한 잡음 영역을 학습하거나 단일 배경 영역으로 악화되는 것을 방지한다. 2) 또한, 공간적 및 외형적 근접성을 고려하여 비정형적인 방식으로 주변 정보를 반영하는 컨텍스트 인지 임베딩(CAE) 모듈을 제안한다. 제안한 방법은 대규모 COCO-Stuff 데이터셋에서 평가되었으며, 물체(Things)와 물질(Stuff) 객체 모두에서 7.19의 mIoU 개선을 달성하였다.