2달 전

FSCE: 대조적 제안 인코딩을 통한 소수 샷 객체 검출

Sun, Bo ; Li, Banghuai ; Cai, Shengcai ; Yuan, Ye ; Zhang, Chi
FSCE: 대조적 제안 인코딩을 통한 소수 샷 객체 검출
초록

새로운 관심사가 매우 적은 학습 예제(few-shot object detection, FSOD)를 통해 이전에 보지 못한 객체를 인식하는 데 초점을 맞추고 있습니다. 최근 연구들은 좋은 특성 임베딩이 유리한 few-shot 학습 성능을 달성하는 데 중요한 역할을 한다는 것을 입증하고 있습니다. 우리는 서로 다른 교차 연합(IoU) 점수를 가진 객체 제안들이 대조적 접근 방식에서 사용되는 이미지 내 증강(intra-image augmentation)과 유사하다는 것을 관찰하였습니다. 이러한 유사성을 활용하여 감독된 대조적 학습(supervised contrastive learning)을 통합하여 FSOD에서 더 강건한 객체 표현을 얻었습니다.우리는 Few-Shot object detection via Contrastive proposals Encoding(FSCE)라는 간단하면서도 효과적인 접근 방식을 제시합니다. 이 방법은 대조성을 인식하는 객체 제안 인코딩(contrastive-aware object proposal encodings)을 학습하여 검출된 객체의 분류를 용이하게 합니다. 우리는 희귀 객체(rare objects)의 평균 정밀도(average precision, AP) 저하가 새로운 인스턴스(novel instances)를 혼동 가능한 클래스(confusable classes)로 잘못 분류하는 것에서 주로 발생한다는 것을 발견하였습니다. 이를 해결하기 위해, 우리의 대조적 제안 인코딩 손실(contrastive proposal encoding loss, CPE loss)을 통해 클래스 내부의 콤팩트성(intra-class compactness)과 클래스 간의 차이(inter-class variance)를 증진시키는 방법을 적용하였습니다.우리의 설계는 모든 샷과 모든 데이터 분할에서 현재 최신 연구들보다 우수한 성능을 보여주며, 표준 벤치마크인 PASCAL VOC에서는 최대 +8.8%, 도전적인 COCO 벤치마크에서는 +2.7%까지 개선되었습니다. 코드는 다음 링크에서 확인 가능합니다: https://github.com/MegviiDetection/FSCE

FSCE: 대조적 제안 인코딩을 통한 소수 샷 객체 검출 | 최신 연구 논문 | HyperAI초신경