
초록
이미지 레벨 라벨만을 사용하는 약한 감독 인스턴스 분할(Weakly Supervised Instance Segmentation, WSIS)은 코어스 주석과 더 미세한 작업을 일치시키는 어려움 때문에 도전적인 과제입니다. 그러나 딥 뉴럴 네트워크(Deep Neural Networks, DNNs)의 발전으로 WSIS는 상당한 관심을 받고 있습니다. 제안 기반 패러다임을 따르면, 단일 인스턴스가 여러 제안으로 표현되는 중복 분할 문제에 직면하게 됩니다. 예를 들어, 개의 사진과 제안을 네트워크에 입력하여 개를 포함하는 단 하나의 제안만 출력되기를 기대하지만, 네트워크는 여러 제안을 출력합니다. 이 문제를 해결하기 위해, 우리는 마스크 교차율(MaskIoU) 헤드를 사용하여 제안의 완전성 점수를 예측하고 중복 분할 문제를 명시적으로 모델링하며 정교화된 의사 라벨을 생성하는 완전 인스턴스 채굴(Complete Instances Mining, CIM) 전략을 통해 WSIS에 대한 새로운 접근 방식을 제안합니다. 우리의 접근 방식은 네트워크가 여러 인스턴스와 완전 인스턴스를 인식하도록 하며, 노이즈 저항 전략(Anti-noise strategy)을 통합하여 그 견고성을 더욱 향상시킵니다. PASCAL VOC 2012 및 MS COCO 데이터셋에서 수행된 경험적 평가는 우리의 방법론이 유의미한 차이로 최신 성능을 달성함을 보여줍니다. 우리의 구현은 https://github.com/ZechengLi19/CIM에서 제공될 것입니다.