
초록
이 논문은 단일 예시를 이용한 객체 수량 측정(One-shot Object Counting)이라는 도전적인 과제를 해결하는 것을 목표로 한다. 새로운, 이전에 보지 못한 카테고리의 객체가 포함된 이미지가 주어졌을 때, 단 하나의 지원 경계 상자(또는 바운딩 박스) 예시만을 이용하여 해당 카테고리의 모든 인스턴스를 정확히 세는 것이 이 과제의 목적이다. 이를 위해 우리는 단 하나의 인스턴스만을 살펴보면 되는(Look At One instance, LaoNet) 수량 측정 모델을 제안한다. 먼저, 자기 주의(Self-Attention)와 상관 주의(Correlative-Attention) 모듈을 결합한 특징 상관 모듈을 도입하여 인스턴스 내부의 관계와 인스턴스 간의 관계를 동시에 학습한다. 이는 다양한 인스턴스들 사이의 회전 및 크기 불일치에 대해 네트워크의 안정성을 높이는 데 기여한다. 또한, 다양한 스케일 정보를 효과적으로 추출할 수 있도록 스케일 집약(Scale Aggregation) 메커니즘을 설계하였다. 기존의 소수 샘플 수량 측정 방법들과 비교했을 때, LaoNet은 최신 기술 수준(SOTA)의 성능을 달성하면서도 빠른 수렴 속도를 보였다. 코드는 곧 공개될 예정이다.