16일 전

Distill-DBDGAN: 초점 외 범위 흐림 탐지를 위한 지식 증류 및 적대적 학습 프레임워크

{Rajiv Ranjan Sahay, Moushumi Medhi, Sankaraganesh Jonna}
초록

초점 외 blur 검출(Defocus Blur Detection, DBD)은 초점 외 blur로 인해 영향을 받은 주어진 이미지에서 흐린 영역을 분할하는 것을 목표로 한다. 이는 다양한 컴퓨터 비전 작업에 있어 핵심적인 전처리 단계이다. 소형 모바일 장치의 증가하는 인기와 함께, 자원 제약 환경에서도 정확하게 초점 외 blur를 탐지할 수 있는 계산 효율적인 방법의 필요성이 점점 커지고 있다. 본 논문에서는 자원 제약 장치에서 각 픽셀이 초점이 맞춰졌는지 혹은 흐려졌는지의 확률을 추정하는 효율적인 초점 외 blur 검출 방법을 제안한다. 최근의 딥 러닝 기반 방법들은 놀라운 성과를 거두었지만, 배경의 혼잡함, 스케일 민감성, 초점이 맞춰진 영역과 초점이 어긋난 blur 영역 간의 저대비 구분 어려움, 그리고 특히 높은 계산 비용과 메모리 요구량 등의 여러 도전 과제를 여전히 안고 있다. 첫 번째부터 세 번째 도전 과제를 해결하기 위해, 입력된 흐린 이미지로부터 blur 맵을 효율적으로 검출할 수 있는 새로운 딥 네트워크를 개발하였다. 구체적으로, 다중 스케일 특징을 딥 네트워크에 통합하여 스케일의 모호성을 해결하고, 고수준의 blur 특징 내에서 비국소적 구조적 상관관계를 동시에 모델링하였다. 마지막 두 가지 문제를 해결하기 위해, 더 큰 교사 네트워크에서 소형 학생 네트워크로 정보를 전달하는 지식 증류(Knowledge Distillation) 방식을 활용하여 DBD 알고리즘을 설계하였다. 모든 네트워크는 출력과 타겟 분포 간의 고차원 일관성을 강제하기 위해 엔드투엔드 방식으로 적대적 학습을 수행한다. 실험 결과, 더 큰 교사 네트워크가 최첨단 성능을 보였으며, 본 논문에서 제안하는 경량 DBD 모델은 정확도의 큰 손실 없이 교사 네트워크의 출력을 효과적으로 모방함을 입증하였다. 코드, 사전 학습된 모델 가중치 및 실험 결과는 공개될 예정이다.

Distill-DBDGAN: 초점 외 범위 흐림 탐지를 위한 지식 증류 및 적대적 학습 프레임워크 | 최신 연구 논문 | HyperAI초신경