
딥러닝은 많은 컴퓨터 비전 응용 분야에서 최신 기술을 발전시키고 있습니다. 그러나 대규모 주석 데이터 저장소에 의존하며, 실제 세계 데이터의 제약 없는 특성을 포착하는 문제는 아직 해결되지 않았습니다. 반감독 학습(SSL)은 주석이 달린 훈련 데이터를 대규모의 주석이 없는 데이터와 결합하여 주석 작업 비용을 줄입니다. 표준 SSL 접근 방식은 주석이 없는 데이터가 주석이 있는 데이터와 동일한 분포에서 나왔다고 가정합니다. 최근에는 더 현실적인 SSL 문제인 오픈 월드 SSL이 소개되었습니다. 이 경우 주석이 없는 데이터는 알려지지 않은 클래스의 샘플을 포함할 수 있습니다. 본 논문에서는 오픈 월드 설정에서 SSL을 해결하기 위한 새로운 의사 라벨 기반 접근 방식을 제안합니다. 우리의 방법론의 핵심은 샘플 불확실성을 활용하고 클래스 분포에 대한 사전 지식을 통합하여 알려진 클래스와 알려지지 않은 클래스 모두에 속하는 주석이 없는 데이터에 대해 신뢰할 수 있는 클래스 분포 인식 의사 라벨을 생성하는 것입니다. 우리의 광범위한 실험 결과는 여러 벤치마크 데이터셋에서 본 접근 방식의 효과를 보여주며, CIFAR-100(약 17%), ImageNet-100(약 5%), Tiny ImageNet(약 9%) 등 일곱 개의 다양한 데이터셋에서 기존 최신 기술보다 크게 우수한 성능을 보임을 입증합니다. 또한, 본 접근 방식이 새로운 클래스 발견 작업을 해결하는 유연성과 불균형한 데이터 처리 시 안정성을 강조하며, 새로운 클래스 수를 추정하는 기술로 보완되는 점도 소개합니다.