11일 전

다중 작업 AET 및 수직 접선 정규성 기반 어두운 객체 탐지

Ziteng Cui, Guo-Jun Qi, Lin Gu, Shaodi You, Zenghui Zhang, Tatsuya Harada
다중 작업 AET 및 수직 접선 정규성 기반 어두운 객체 탐지
초록

어두운 환경은 광자 수 부족과 부정적인 노이즈로 인해 컴퓨터 비전 알고리즘에 도전 과제가 된다. 어두운 환경에서의 객체 탐지 성능을 향상시키기 위해, 조명 변화의 내재적 패턴을 탐구할 수 있는 새로운 다중 작업 자동인코딩 변환(MAET, Multitask Auto Encoding Transformation) 모델을 제안한다. MAET는 자기지도 학습(self-supervised) 방식을 통해 물리적 노이즈 모델과 이미지 신호 처리(Image Signal Processing, ISP)를 고려한 현실적인 조명 저하 변환을 인코딩하고 디코딩함으로써 내재적인 시각 구조를 학습한다. 이러한 표현 기반으로, 경계 박스 좌표와 클래스를 디코딩함으로써 객체 탐지 작업을 수행한다. 두 작업 간의 과도한 얽힘을 방지하기 위해, MAET는 직교 접선 정규화(orthogonal tangent regularity)를 도입하여 객체 특징과 저하 특징을 분리한다. 이는 각 작업의 출력에 대한 접선 간의 직교성을 최대화함으로써 다중 작업 예측을 기하학적으로 정식화할 수 있는 매개변수화된 다양체(parametric manifold)를 형성한다. 제안된 프레임워크는 주류 객체 탐지 아키텍처를 기반으로 구현 가능하며, VOC 및 COCO와 같은 일반적인 객체 탐지 데이터셋을 사용하여 엔드투엔드(end-to-end)로 직접 학습할 수 있다. 합성 및 실세계 데이터셋을 활용하여 최신 기술(SOTA, State-of-the-Art) 수준의 성능을 달성하였다. 코드는 https://github.com/cuiziteng/MAET 에서 공개되어 있다.

다중 작업 AET 및 수직 접선 정규성 기반 어두운 객체 탐지 | 최신 연구 논문 | HyperAI초신경