2달 전

모든 것을 세는 법 배우기

Ranjan, Viresh ; Sharma, Udbhav ; Nguyen, Thu ; Hoai, Minh
모든 것을 세는 법 배우기
초록

기존의 시각적 카운팅 연구는 주로 한 번에 하나의 특정 범주에 초점을 맞추어 진행되었습니다. 예를 들어 사람, 동물, 세포 등이 그 범주입니다. 본 논문에서는 모든 것을 카운팅하는 것, 즉 해당 범주에서 몇 개의 주석된 인스턴스만 제공되는 경우에도 그 범주 내의 객체들을 카운팅하는 문제에 관심을 가지고 있습니다. 이를 위해 우리는 카운팅을 소수 샘플 회귀(few-shot regression) 작업으로 정의하였습니다. 이 작업을 해결하기 위해, 쿼리 이미지와 함께 쿼리 이미지에서 소수의 예시 객체를 입력으로 받아, 쿼리 이미지 내 모든 관심 객체들의 존재에 대한 밀도 맵을 예측하는 새로운 방법을 제안합니다. 또한, 테스트 시점에서 소수의 예시 객체만 사용하여 우리의 네트워크가 새로운 시각적 범주에 적응할 수 있는 새로운 적응 전략도 제시합니다. 우리는 147개의 객체 범주를 포함하고 6000여 장 이상의 이미지를 보유한 데이터셋을 소개하며, 이 데이터셋은 소수 샘플 카운팅 작업에 적합합니다. 이 이미지는 점과 경계 상자 두 가지 유형의 주석이 달려 있으며, 이러한 주석은 소수 샘플 카운팅 모델 개발에 활용될 수 있습니다. 본 데이터셋에서 수행된 실험 결과는 우리의 방법이 여러 최신 객체 검출기와 소수 샘플 카운팅 접근법보다 우수한 성능을 보임을 확인하였습니다. 우리의 코드와 데이터셋은 https://github.com/cvlab-stonybrook/LearningToCountEverything 에서 확인할 수 있습니다.

모든 것을 세는 법 배우기 | 최신 연구 논문 | HyperAI초신경