2달 전

Pre-trained ImageNet 아키텍처의 실시간 로드 주행 이미지 의미 분할을 위한 변호

Marin Oršić; Ivan Krešo; Petra Bevandić; Siniša Šegvić
Pre-trained ImageNet 아키텍처의 실시간 로드 주행 이미지 의미 분할을 위한 변호
초록

최근 도로 주행 데이터셋에서 의미 분할 접근법의 성공으로 인해 관련 응용 분야에 대한 관심이 증가하고 있습니다. 이러한 응용 프로그램 중 많은 부분은 자동차, 드론 및 다양한 로봇과 같은 모바일 플랫폼에서 실시간 예측을 포함합니다. 실시간 환경은 매우 높은 계산 복잡도 때문에 도전적입니다. 이전의 많은 연구는 일반 목적 아키텍처보다 깊이, 너비 및 층 용량을 줄여서 계산 복잡도를 감소시키는 맞춤형 경량 아키텍처를 통해 이 문제에 대응했습니다. 우리는 다양한 컴퓨팅 예산 범위에서 상당히 더 우수한 성능을 달성하는 대안적인 접근법을 제안합니다.우선, 주요 인식 엔진으로 경량 일반 목적 아키텍처를 활용합니다. 그 다음, 횡방향 연결(lateral connections)을 사용한 경량 업샘플링(light-weight upsampling)을 가장 비용 효율적인 해결책으로 활용하여 예측 해상도를 복원합니다. 마지막으로, 여러 해상도에서 공유된 특징들을 새로운 방식으로 융합하여 수신 필드(receptive field)를 확장하는 방법을 제안합니다.여러 도로 주행 데이터셋에서 수행한 실험 결과, 제안된 접근법이 ImageNet 사전 학습 파라미터를 사용하거나 처음부터 학습할 때 모두 상당한 우위를 보임을 확인할 수 있었습니다. 우리의 Cityscapes 테스트 제출작인 SwiftNetRN-18은 75.5%의 MIoU(Mean Intersection over Union)를 제공하며, GTX1080Ti 그래픽 카드에서 1024x2048 이미지에 대해 39.9 Hz의 처리 속도를 달성했습니다.

Pre-trained ImageNet 아키텍처의 실시간 로드 주행 이미지 의미 분할을 위한 변호 | 최신 연구 논문 | HyperAI초신경