
RGB 열화상 장면 분할은 최근 컴퓨터 비전 분야에서 점점 더 많은 연구 관심을 받고 있다. 그러나 기존 대부분의 방법들은 예측 맵에 대한 경계 추출 성능이 낮으며, 고수준 특징을 충분히 활용하지 못한다. 또한 이러한 방법들은 RGB와 열화상 모달리티의 특징을 단순히 융합할 뿐, 포괄적인 융합 특징을 얻는 데는 한계가 있다. 이러한 문제를 해결하기 위해, 본 연구에서는 RGB 열화상 장면 분할을 위한 엣지 인식 지도 융합 네트워크(Edge-aware Guidance Fusion Network, EGFNet)를 제안한다. 먼저, RGB 및 열화상 이미지를 활용하여 사전 엣지 맵을 생성함으로써 예측 맵 내의 세부 정보를 포착하고, 이를 특징 맵에 통합한다. RGB와 열화상 정보를 효과적으로 융합하기 위해, 충분한 다중 모달 융합을 보장하는 다중 모달 융합 모듈을 제안한다. 고수준 의미 정보의 중요성을 고려하여, 고수준 특징에서 풍부한 의미 정보를 추출하기 위해 전역 정보 모듈과 의미 정보 모듈을 도입한다. 디코딩 과정에서는 단순한 원소별 덧셈을 사용하여 계단식 특징 융합을 수행한다. 마지막으로, 분할 정확도를 향상시키기 위해 의미 맵과 경계 맵에 다중 태스크 심층 감독을 적용한다. 제안된 EGFNet의 효과성을 검증하기 위해 기준 데이터셋에서 광범위한 실험을 수행하였으며, 최신 기술 대비 뛰어난 성능을 입증하였다. 코드와 실험 결과는 https://github.com/ShaohuaDong2021/EGFNet 에서 확인할 수 있다.