2달 전
Lovász-Softmax 손실: 신경망에서 교차-합집합 비율 최적화를 위한 처리 가능한 대용량
Maxim Berman; Amal Rannen Triki; Matthew B. Blaschko

초록
자카드 지수(Jaccard index)는 교차-합집합 비율(intersection-over-union score)이라고도 불리며, 이미지 분할 결과 평가에서 주로 사용됩니다. 이는 인식적 특성, 크기 불변성(scale invariance) - 작은 객체에 적절한 중요성을 부여하며, 픽셀별 손실(per-pixel losses)과 비교하여 적절한 거짓 음성(false negatives)의 계산 때문입니다. 본 연구에서는 의미론적 이미지 분할(semantic image segmentation)의 맥락에서 부분 모듈러 손실(submodular losses)의 볼라시 확장(Lovász extension)을 기반으로 한 신경망에서 평균 교차-합집합 손실(mean intersection-over-union loss)을 직접 최적화하는 방법을 제시합니다. 이 손실 함수는 전통적으로 사용되는 크로스 엔트로피 손실(cross-entropy loss)보다 자카드 지수 측정에서 더 우수한 성능을 보임을 입증하였습니다. 우리는 개별 이미지의 자카드 지수를 최적화하는 것과 전체 데이터셋에 대한 자카드 지수를 최적화하는 것 사이의 정량적 및 정성적인 차이를 보여줍니다. 또한, 우리의 방법이 의미론적 분할 파이프라인에서 미치는 영향을 평가하고, 최신 딥 러닝 분할 아키텍처를 사용하여 Pascal VOC와 Cityscapes 데이터셋에서 실질적으로 향상된 교차-합집합 분할 점수를 보임을 증명합니다.