
초록
우리는 검출 및 그룹화 작업을 위해 합성곱 신경망(CNN)을 감독하는 새로운 방법인 연관 임베딩(associative embedding)을 소개합니다. 다중 사람 자세 추정, 인스턴스 분할, 그리고 다중 객체 추적과 같은 여러 컴퓨터 비전 문제들이 이러한 방식으로 정의될 수 있습니다. 일반적으로 검출의 그룹화는 다단계 파이프라인을 통해 이루어지지만, 우리는 네트워크가 동시에 검출 결과와 그룹 할당을 출력하도록 가르치는 접근법을 제안합니다. 이 기술은 픽셀 단위 예측을 생성하는 최신 네트워크 아키텍처에 쉽게 통합될 수 있습니다. 우리는 이 방법을 다중 사람 자세 추정과 인스턴스 분할에 적용하는 방법을 설명하고, MPII와 MS-COCO 데이터셋에서 다중 사람 자세 추정에 대한 최고 성능을 보고합니다.