11일 전

맥락적 편향 시각 인식을 위한 인과 보정 주의 메커니즘

{Thomas H. Li, Ge Li, Jingjia Huang, Ruyang Liu}
맥락적 편향 시각 인식을 위한 인과 보정 주의 메커니즘
초록

시각적 주의(visual attention)는 항상 강건한 예측을 위한 필수적인 객체 표현을 포착하지는 않는다. 주의 모듈은 학습 과정에서 유용하다고 판단되는 타깃 객체뿐만 아니라 흔히 함께 등장하는 맥락(context)까지 강조하는 경향이 있다. 이 문제는 맥락의 혼란 효과(confounding effect)에 기인하며, 이는 객체와 예측 사이에 잘못된 인과 관계를 형성하게 되고, 시각적 주의의 존재로 인해 더욱 악화된다. 본 논문에서는 맥락 편향에 대해 강건한 인과적 객체 특징을 학습하기 위해, 시각 인식을 위한 새로운 주의 모듈인 개입형 이중 주의(Interventional Dual Attention, IDA)를 제안한다. 구체적으로 IDA는 다중 샘플링 개입(multiple sampling intervention)을 활용한 두 개의 주의 레이어를 채택하여, 혼란 요인으로 작용하는 맥락에 대한 주의의 영향을 보정한다. 본 방법은 모델 독립적(model-agnostic)이므로 다양한 백본(백본, backbone)에 쉽게 적용 가능하다. 광범위한 실험을 통해 제안한 모델이 계산량을 낮추면서도 분류 및 검출 성능에서 두드러진 향상을 달성함을 확인하였다. 특히 MS-COCO와 PASCAL-VOC에서 다중 레이블 분류(task)에서 최고의 성능을 기록하며, 현재까지의 최고 수준의 결과를 달성하였다.

맥락적 편향 시각 인식을 위한 인과 보정 주의 메커니즘 | 최신 연구 논문 | HyperAI초신경