
최신 방법들의 의미 분할(sementic segmentation) 효율성을 개선하기 위해서는 점증하는 계산 비용을 극복하고 전역 및 국소 컨텍스트에서의 의미 정보 융합과 같은 문제들을 해결해야 한다. 최근 합성곱 신경망(CNNs)이 의미 분할에서 성공과 직면한 문제를 바탕으로, 본 연구에서는 고유한 효율적인 잔차 네트워크인 Efficient-ResNet을 사용한 인코더-디코더 아키텍처를 제안한다. Attention-boosting gates (AbGs)와 attention-boosting modules (AbMs)는 인코더 부분에서 효율적인 잔차 네트워크의 전역 컨텍스트 출력과 동일한 크기로 등변(equivariant) 및 특징 기반 의미 정보를 융합하는 것을 목표로 배치된다. 디코더 네트워크는 AbM에 영감을 받은 추가적인 attention-fusion networks (AfNs)를 통해 개발되었다. AfNs는 디코더 부분에서 추가적인 합성곱 층을 배치하여 의미 정보의 일대일 변환 효율성을 향상시키도록 설계되었다. 본 네트워크는 어려운 CamVid와 Cityscapes 데이터셋에서 테스트되었으며, 제안된 방법들은 잔차 네트워크에서 상당한 개선 효과를 보였다. 최선의 지식范围内, 개발된 SERNet-Former 네트워크는 CamVid 데이터셋에서 최고 수준의 결과(84.62% 평균 IoU)를 달성하였으며, Cityscapes 검증 데이터셋에서도 도전적인 결과(87.35% 평균 IoU)를 얻었다.注:在最后一句中,“최선의 지식范围内” 是中文,可能是误输入。正确的韩文应该是“우리가 알고 있는 한” 或者 “우리의 최선의 지식으로”。以下是修正后的版本:본 네트워크는 어려운 CamVid와 Cityscapes 데이터셋에서 테스트되었으며, 제안된 방법들은 잔차 네트워크에서 상당한 개선 효과를 보였다. 우리가 알고 있는 한, 개발된 SERNet-Former 네트워크는 CamVid 데이터셋에서 최고 수준의 결과(84.62% 평균 IoU)를 달성하였으며, Cityscapes 검증 데이터셋에서도 도전적인 결과(87.35% 평균 IoU)를 얻었다.