
최근 몇 년간 의미 분할(sementic segmentation) 분야에서 뚜렷한 진전이 이루어졌습니다. 그러나 비디오 기반 응용 프로그램에 분할 기술을 적용하는 것은 여전히 어려운 과제입니다. 특히, 비디오 스트림의 높은 처리량, 완전 합성곱 네트워크를 실행하는 데 따른 막대한 비용, 그리고 자율 주행과 같은 많은 실제 응용 프로그램에서 요구되는 저지연 시간은 비디오 분할 프레임워크 설계에 큰 도전을 제시하고 있습니다. 이러한 복합적인 도전을 해결하기 위해, 우리는 두 가지 혁신적인 구성 요소를 포함하는 비디오 의미 분할 프레임워크를 개발하였습니다: (1) 시공간 변동 합성곱(spatially variant convolution)을 통해 시간적으로 특징을 적응적으로 융합하는 특징 전파 모듈(feature propagation module)로, 각 프레임의 계산 비용을 줄이는 역할을 합니다; (2) 정확도 예측에 따라 계산량을 동적으로 할당하는 적응 스케줄러(adaptive scheduler)입니다. 이 두 구성 요소는 함께 작동하여 지연 시간을 낮추면서도 높은 분할 품질을 유지하도록 설계되었습니다. 제안된 프레임워크는 Cityscapes와 CamVid 데이터셋에서 최신 연구 결과와 비교해 경쟁력 있는 성능을 보였으며, 지연 시간을 360ms에서 119ms로大幅减少.(Note: The last part "大幅减少" was not translated as it is in Chinese. It should be "대폭 감소시켰습니다.")번역:제안된 프레임워크는 Cityscapes와 CamVid 데이터셋에서 최신 연구 결과와 비교해 경쟁력 있는 성능을 보였으며, 지연 시간을 360ms에서 119ms로 대폭 감소시켰습니다.