
초록
검출은 이미지에서 객체를 축 정렬된 상자로 식별하는 과정입니다. 대부분의 성공적인 객체 검출기는 거의 완전한 잠재적 객체 위치 목록을 열거하고 각각을 분류합니다. 이 방법은 비효율적이며 추가적인 후처리가 필요합니다. 본 논문에서는 다른 접근 방식을 제안합니다. 우리는 객체를 바운딩 박스의 중심점으로 모델링합니다. 우리의 검출기는 키포인트 추정을 사용하여 중심점을 찾고, 크기, 3D 위치, 방향, 심지어 자세와 같은 모든 다른 객체 속성에 대해 회귀 분석을 수행합니다. 우리의 중심점 기반 접근 방식인 CenterNet은 엔드투엔드 미분 가능하며, 더 간단하고 빠르며 해당 바운딩 박스 기반 검출기보다 더 정확합니다. CenterNet은 MS COCO 데이터셋에서 최상의 속도-정확도 균형을 달성하는데, 142 FPS에서 28.1% AP, 52 FPS에서 37.4% AP, 그리고 다중 스케일 테스트를 통해 1.4 FPS에서 45.1% AP를 기록하였습니다. 우리는 동일한 접근 방식을 KITTI 벤치마크에서의 3D 바운딩 박스 추정과 COCO 키포인트 데이터셋에서의 인간 자세 추정에 적용하였습니다. 우리의 방법은 복잡한 다단계 방법들과 경쟁력을 갖추고 있으며 실시간으로 실행됩니다.