
초록
최근 딥 컨볼루션 신경망(DCNN)의 등장으로 시각적 주목성 예측 연구에서의 개선이 인상적입니다. 다음 단계의 개선을 위한 가능한 방향 중 하나는 DCNN 구조 내에 계산 효율적인 모듈을 사용하여 다중 스케일 주목성 영향 요소를 완전히 특성화하는 것입니다. 본 연구에서는 시각적 주목성 예측을 위해 엔드투엔드 희소 인셉션 네트워크(DINet)를 제안하였습니다. 이 모델은 매우 제한된 추가 매개변수로 다중 스케일 문맥 특성을 효과적으로 포착합니다. 기존의 인셉션 모듈이 다양한 커널 크기를 가진 병렬 표준 컨볼루션을 사용하는 것과 달리, 제안된 희소 인셉션 모듈(DIM)은 다양한 확장률을 가진 병렬 희소 컨볼루션을 사용하여 계산 부하를 크게 줄이면서 피처 맵에서 수용 필드의 다양성을 향상시킵니다. 또한, 선형 정규화 기반 확률 분포 거리 측정 지표를 손실 함수로 사용함으로써 주목성 모델의 성능이 더욱 향상되었습니다. 이를 통해 전역 주목성 추론을 위한 확률 분포 예측 작업으로 주목성 예측을 공식화할 수 있으며, 일반적인 픽셀 단위 회귀 문제와는 달라집니다. 여러 어려운 주목성 벤치마크 데이터셋에 대한 실험 결과는 제안된 손실 함수를 사용한 DINet가 최단 시간 내에 최고 수준의 성능을 달성할 수 있음을 보여주었습니다.