
딥러닝의 등장으로 객체 검출은 하향식(bottom-up)에서 상향식(top-down) 인식 문제로 변화하였습니다. 최신 알고리즘들은 객체 위치의 거의 완전한 목록을 열거하고 각각을 객체인지 비객체인지 분류합니다. 본 논문에서는 하향식 접근법이 여전히 경쟁력을 유지하고 있음을 보여줍니다. 우리는 표준 키포인트 추정 네트워크를 사용하여 객체의 네 개의 극점(가장 위, 가장 왼쪽, 가장 아래, 가장 오른쪽)과 하나의 중심점을 감지합니다. 이 다섯 개의 키포인트가 기하학적으로 일치할 경우 그룹화하여 바운딩 박스를 생성합니다.这样一来,对象检测就完全变成了一个基于外观的特征点估计问题,无需区域分类或隐式特征学习。对象 검출은 이제 외관 기반의 순수한 키포인트 추정 문제로 변모하며, 영역 분류나 암시적인 특징 학습 없이 수행됩니다. 제안된 방법은 COCO test-dev에서 바운딩 박스 AP 43.2%를 달성하며, 최신 지역 기반 검출 방법들과 유사한 성능을 보입니다. 또한, 우리에게 추정된 극점들은 COCO 마스크 AP 18.9%로 원시 바운딩 박스보다 훨씬 더 우수한 거친 팔각형 마스크를 직접 생성합니다. 극점 안내 세그멘테이션이 이를 더욱 개선하여 34.6%의 마스크 AP를 달성하였습니다.为了确保句子结构更加符合韩语读者的阅读习惯,我对部分句子进行了优化调整。以下是优化后的版本:딥러닝의 등장으로 객체 검출은 하향식(bottom-up)에서 상향식(top-down) 인식 문제로 변화하였습니다. 최신 알고리즘들은 객체 위치의 거의 완전한 목록을 열거하고 각각을 객체 또는 비객체로 분류합니다. 본 논문에서는 하향식 접근법이 여전히 경쟁력을 유지하고 있음을 보여줍니다. 우리는 표준 키포인트 추정 네트워크를 사용하여 객체의 네 개 극점(가장 위, 가장 왼쪽, 가장 아래, 가장 오른쪽)과 하나의 중심점을 감지합니다. 이 다섯 개 키포인트가 기하학적으로 일치할 경우 그룹화하여 바운딩 박스를 생성합니다. 이렇게 함으로써 객체 검출은 외관 기반의 순수한 키포인트 추정 문제로 변모하며, 영역 분류나 암시적인 특징 학습 없이 수행됩니다. 제안된 방법은 COCO test-dev에서 바운딩 박스 AP 43.2%를 달성하며, 최신 지역 기반 검출 방법들과 유사한 성능을 보입니다. 또한, 우리가 추정한 극점들은 COCO 마스크 AP 18.9%로 원시 바운딩 박스보다 훨씬 더 우수한 거친 팔각형 마스크를 직접 생성합니다. 극점 안내 세그멘테이션은 이를 더욱 개선하여 34.6%의 마스크 AP를 달성하였습니다.