17일 전

ERFNet: 실시간 세분화를 위한 효율적인 잔차 인수 분해 컨브넷

{L. M. Bergasa and R. Arroyo, E. Romera, J. M. Alvarez}
초록

세마틱 세그멘테이션은 지능형 차량(Intelligent Vehicles, IV)의 대부분의 인지 요구 사항을 통합적으로 해결하는 도전적인 과제이다. 딥 신경망은 이미지 내 각 픽셀 수준에서 여러 객체 카테고리를 정확하게 분류할 수 있도록 엔드투엔드로 학습할 수 있기 때문에 이 과제에서 뛰어난 성능을 발휘한다. 그러나 최신 세마틱 세그멘테이션 기법들 사이에는 높은 정확도와 계산 자원 사용 간의 적절한 균형이 아직 확립되지 않아, 실차 적용에 제한을 받고 있다. 본 논문에서는 실시간으로 실행 가능하면서도 정확한 세마틱 세그멘테이션을 제공할 수 있는 딥 아키텍처를 제안한다. 제안하는 아키텍처의 핵심은 잔차 연결(residual connections)과 분해형 합성곱(factorized convolutions)을 활용하여 높은 효율성을 유지하면서도 뛰어난 정확도를 달성하는 새로운 레이어이다. 제안한 방법은 단일 Titan X에서 83 FPS 이상, 임베디드 GPU인 Jetson TX1에서는 7 FPS로 실행이 가능하다. 공개된 Cityscapes 데이터셋을 대상으로 수행한 포괄적인 실험 결과, 본 시스템은 최신 기술 수준과 유사한 정확도를 달성하면서도, 정밀도가 뛰어난 다른 아키텍처들에 비해 계산 속도가 수 개 차수 빠르다는 점을 입증하였다. 이러한 정확도와 속도 사이의 우수한 균형은 본 모델이 지능형 차량 응용 분야에서 장면 이해에 이상적인 접근법이 될 수 있음을 보여준다. 코드는 공개되어 있으며, 다음 링크에서 확인할 수 있다: https://github.com/Eromera/erfnet

ERFNet: 실시간 세분화를 위한 효율적인 잔차 인수 분해 컨브넷 | 최신 연구 논문 | HyperAI초신경