17일 전

암묵적 다중 스펙트럴 트랜스포머: 가벼운 크기와 높은 효율성을 갖춘 가시광선에서 적외선 이미지 변환 모델

Yijia Chen, Pinghua Chen, Xiangxin Zhou, Yingtie Lei, Ziyang Zhou, Mingxian Li
암묵적 다중 스펙트럴 트랜스포머: 가벼운 크기와 높은 효율성을 갖춘 가시광선에서 적외선 이미지 변환 모델
초록

컴퓨터 비전 분야에서 가시광선 영상은 저조도 환경에서 낮은 대비를 보이며, 큰 도전 과제를 제기한다. 적외선 영상은 이 문제에 대한 잠재적인 해결책을 제공하지만, 그 활용은 높은 비용과 실용적인 제약을 수반한다. 최근 딥러닝 기술의 발전, 특히 생성적 적대 신경망(GANs)의 도입으로 인해 가시광선 영상에서 적외선 영상으로의 변환 기술이 가능해졌으나, 이러한 방법들은 종종 불안정한 학습 과정을 경험하며 최적의 출력을 도출하지 못하는 경우가 있다. 이러한 문제를 해결하기 위해, 우리는 가시광선 영상을 고해상도 적외선 영상으로 효율적으로 변환할 수 있는 새로운 엔드투엔드 기반의 트랜스포머 모델을 제안한다. 먼저, 텍스처 매핑 모듈과 색채 인지 어댑터가 가시광선 영상에서 텍스처 및 색채 특징을 추출한다. 이후 동적 융합 집계 모듈이 이러한 특징들을 통합하며, 마지막으로 색채 인지 어댑터와 강화된 인지 주의 메커니즘의 상호작용을 통해 적외선 영상으로의 변환이 정교하게 개선된다. 포괄적인 벤치마킹 실험을 통해 제안한 모델이 기존 방법들을 능가함을 확인하였으며, 정성적 및 정량적으로 모두 훨씬 뛰어난 품질의 적외선 영상을 생성함을 입증하였다. 또한, 제안된 모델은 다른 방법들보다 더 효과적인 적외선 영상 기반의 후속 응용을 가능하게 한다.