Hybrid Labels을 활용한 주요 객체 검출을 위한 약간의 감독 학습 프레임워크

완전 지도 하이라이트 객체 검출(SOD) 방법은 큰 발전을 이뤘지만, 이러한 방법들은 종종 많은 양의 픽셀 단위 주석에 의존하며, 이는 시간과 노동을 많이 필요로 합니다. 본 논문에서는 전통적인 비지도 방법으로 생성된 대량의 거친 라벨과 소량의 실제 라벨을 포함하는 혼합 라벨 하에서 새로운 약간 지도 SOD 작업에 초점을 맞춥니다. 이 작업에서 라벨 노이즈와 양적 불균형 문제를 해결하기 위해, 우리는 세 가지 정교한 학습 전략을 갖춘 새로운 파이프라인 프레임워크를 설계했습니다. 모델 프레임워크 측면에서, 우리는 작업을 라벨 정제 서브태스크와 하이라이트 객체 검출 서브태스크로 분리하여 서로 협력하고 번갈아 가며 학습하도록 했습니다. 구체적으로, R-Net은 Blender with Guidance and Aggregation Mechanisms (BGA)를 탑재한 두 스트림 인코더-디코더 모델로 설계되어, 더 신뢰할 수 있는 의사라벨을 생성하기 위해 거친 라벨들을 수정합니다. 반면에 S-Net은 현재 R-Net이 생성한 의사라벨로 감독되는 교체 가능한 SOD 네트워크입니다. 참고로, 테스트 시에는 학습된 S-Net만 사용하면 됩니다. 또한, 네트워크 학습의 효과성과 효율성을 보장하기 위해, 우리는 교대 반복 메커니즘, 그룹별 점진적 메커니즘, 그리고 신뢰성 검증 메커니즘 등 세 가지 학습 전략을 설계했습니다. 다섯 개의 SOD 벤치마크에서 수행한 실험 결과는 우리의 방법이 약간 지도/비지도 방법들과 비교해 질적 및 양적으로 경쟁력을 갖는 성능을 달성함을 보여줍니다.