
초록
최근 컨볼루션 신경망(CNN)의 발전으로 이미지에서 객체 위치를 찾는 데 뛰어난 결과를 달성하였습니다. 이러한 네트워크에서는 학습 과정에서 일반적으로 경계 상자(bounding boxes) 또는 예상되는 최대 객체 수를 제공해야 합니다. 본 논문에서는 주로 손으로 그려지고 라벨링에 시간이 많이 소요되는 경계 상자를 사용하지 않고 객체 위치를 추정하는 작업을 다룹니다. 우리는 객체 위치를 추정하기 위해 어떤 완전 컨볼루션 네트워크(FCN)에서도 사용할 수 있는 손실 함수(loss function)를 제안합니다. 이 손실 함수는 두 개의 순서가 없는 점 집합 사이의 평균 하우스도르프 거리(average Hausdorff distance)의 수정 버전입니다. 제안된 방법은 경계 상자, 영역 제안(region proposals), 슬라이딩 윈도우(sliding windows) 등의 개념을 포함하지 않습니다. 우리는 사람들의 머리, 눈동자의 중심, 식물의 중심을 찾기 위해 설계된 세 가지 데이터셋을 사용하여 우리의 방법을 평가하였습니다. 우리는 일반적인 객체 검출기와 눈동자 추적에 맞춰 조정된 방법들보다 우수한 성능을 보였습니다.