11일 전

주시화와 깜빡임 운동을 활용한 약한 감독 하에 지역화 성능 향상 탐구

{Kaushik Roy, Amitangshu Mukherjee, Manish Nagaraj, Timur Ibrayev}
주시화와 깜빡임 운동을 활용한 약한 감독 하에 지역화 성능 향상 탐구
초록

딥 신경망은 컴퓨터 비전 작업에서 특징 추출 엔진으로서 사실상의 표준이 되었으며, 널리 사용되고 있다. 현재의 접근 방식은 입력을 일괄적으로 동일한 해상도로 처리하고, 모든 예측을 한 번에 수행하는 것이다. 그러나 인간의 시각은 ‘능동적’인 과정으로, 시각 영역 내에서 한 초점점에서 다른 초점점으로 빠르게 전환할 뿐만 아니라, 이러한 초점점 중심으로 공간적으로 변화하는 주의를 적용한다. 이러한 격차를 메우기 위해, 중심부 집중(foveation)과 눈의 급속 이동(saccades)이라는 생물학적으로 타당한 메커니즘을 도입하여 능동적인 객체 위치 추정 프레임워크를 제안한다. 중심부 집중은 입력의 다양한 영역을 서로 다른 수준의 세부 정보로 처리할 수 있게 하고, 눈의 급속 이동은 이러한 중심부 집중된 영역의 초점을 전환할 수 있게 한다. 실험 결과, 이러한 메커니즘이 객체의 모든 핵심 부분을 포착하면서 불필요한 배경 잡음은 최소화함으로써 예측된 경계상자(박스)의 품질을 향상시킴을 보여준다. 또한, 이미지당 단일 객체만 포함된 데이터로만 훈련된 모델이 다중 객체를 탐지할 수 있도록 하여 모델의 강건성(resiliency)을 높인다. 마지막으로, 흥미로운 ‘오리-토끼’ 광학적 환각(illusion)을 활용하여 제안한 방법이 인간의 인지와 얼마나 잘 일치하는지 탐구한다. 코드는 다음 링크에서 확인할 수 있다: https://github.com/TimurIbrayev/FALcon.

주시화와 깜빡임 운동을 활용한 약한 감독 하에 지역화 성능 향상 탐구 | 최신 연구 논문 | HyperAI초신경