2달 전

밀집 객체 검출을 위한 Focal 손실

Lin, Tsung-Yi ; Goyal, Priya ; Girshick, Ross ; He, Kaiming ; Dollár, Piotr
밀집 객체 검출을 위한 Focal 손실
초록

현재까지 가장 높은 정확도를 가진 객체 검출기는 R-CNN에서 대중화된 두 단계 접근 방식을 기반으로 하고 있습니다. 이 방식에서는 분류기가 후보 객체 위치의 희소 집합에 적용됩니다. 반면에, 가능한 객체 위치의 규칙적이고 밀집된 샘플링에 적용되는 한 단계 검출기들은 더 빠르고 간단할 잠재력이 있지만, 지금까지는 두 단계 검출기들의 정확도를 따라잡지 못했습니다. 본 논문에서는 이러한 현상이 왜 발생하는지를 조사합니다. 우리는 밀집형 검출기의 학습 과정에서 겪는 극심한 전경-배경 클래스 불균형이 주요 원인임을 발견하였습니다. 이 클래스 불균형 문제를 해결하기 위해, 잘 분류된 예제들에 대한 손실을 감소시키도록 표준 크로스 엔트로피 손실 함수를 재구성하는 방법을 제안합니다. 우리의 새로운 Focal Loss(초점 손실)는 학습 과정에서 많은 수의 쉽게 분류되는 음성 예제들이 검출기를 압도하지 않도록 하며, 어려운 예제들의 희소 집합에 초점을 맞춥니다. 우리의 손실 함수의 효과성을 평가하기 위해, RetinaNet이라는 간단한 밀집형 검출기를 설계하고 학습시켰습니다. 결과는 Focal Loss로 학습된 RetinaNet이 이전 한 단계 검출기들과 동등한 속도를 유지하면서 모든 기존 최신 두 단계 검출기들의 정확도를 초월할 수 있음을 보여줍니다. 코드는 다음 링크에서 확인할 수 있습니다: https://github.com/facebookresearch/Detectron.