
초록
수중 불순물의 빛 흡수와 산란은 수중 이미지 품질을 저하시킵니다. 기존의 데이터 기반 수중 이미지 강화(UIE) 기술들은 다양한 수중 장면과 고정밀 참조 이미지를 포함하는 대규모 데이터셋의 부족으로 인해 제약을 받고 있습니다. 또한, 색상 채널과 공간 영역에서 일관되지 않은 감쇠가 충분히 고려되지 않아 강화 효과가 제한적입니다. 본 연구에서는 5004개의 이미지 쌍을 포함하는 대규모 수중 이미지(LSUI) 데이터셋을 구축하였으며, 처음으로 트랜스포머 모델을 UIE 작업에 도입한 U-shape 트랜스포머 네트워크를 보고합니다. U-shape 트랜스포머는 채널별 다중 스케일 특성 융합 트랜스포머(CMSFFT) 모듈과 공간별 전역 특성 모델링 트랜스포머(SGFMT) 모듈이 통합되어 있으며, 이는 더 심각한 감쇠를 겪는 색상 채널과 공간 영역에 대한 네트워크의 주의력을 강화합니다. 또한, 대비와 포화도를 더욱 개선하기 위해 인간 시각 원칙에 따라 RGB, LAB 및 LCH 색상 공간을 결합한 새로운 손실 함수를 설계하였습니다. 사용 가능한 데이터셋에 대한 광범위한 실험 결과, 보고된 기술이 최소 2dB 이상 우수한 성능을 보임을 확인하였습니다.