2달 전

SegNet: 이미지 세그멘테이션을 위한 딥 컨볼루셔널 인코더-디코더 아키텍처

Vijay Badrinarayanan; Alex Kendall; Roberto Cipolla
SegNet: 이미지 세그멘테이션을 위한 딥 컨볼루셔널 인코더-디코더 아키텍처
초록

우리는 세맨틱 픽셀 단위 분할을 위한 새로운이고 실용적인 딥 풀리 컨볼루셔널 뉴럴 네트워크 구조인 SegNet을 제시합니다. 이 핵심 학습 가능한 분할 엔진은 인코더 네트워크, 해당 인코더에 따른 디코더 네트워크 및 픽셀 단위 분류층으로 구성됩니다. 인코더 네트워크의 구조는 VGG16 네트워크의 13개 컨볼루션 계층과 위상적으로 동일합니다. 디코더 네트워크의 역할은 저해상도 인코더 특성 맵을 픽셀 단위 분류를 위한 전체 입력 해상도 특성 맵으로 매핑하는 것입니다. SegNet의 혁신성은 디코더가 그에 상응하는 인코더에서 최대 풀링 단계에서 계산된 풀링 색인을 사용하여 비선형 업샘플링을 수행하는 방식에 있습니다. 이는 업샘플링을 학습할 필요성을 제거합니다. 업샘플링된 맵은 희소하며, 이후 학습 가능한 필터로 합성곱 연산을 거쳐 밀집된 특성 맵을 생성합니다. 우리는 제안한 구조를 광범위하게 채택되고 있는 FCN 및 잘 알려진 DeepLab-LargeFOV, DeconvNet 구조와 비교하였습니다. 이 비교는 좋은 분할 성능을 달성하기 위해 필요한 메모리와 정확도 간의 균형을 보여줍니다.SegNet은 주로 장면 이해 응용 프로그램에 의해 동기 부여되었습니다. 따라서 추론 시 메모리 효율성과 계산 시간 면에서 효율적임이 설계되었습니다. 또한 다른 경쟁 구조보다 학습 가능한 매개변수 수가 현저히 적습니다. 우리는 SegNet과 다른 구조들을 도로 장면 및 SUN RGB-D 실내 장면 분할 작업에서 제어된 벤치마킹을 수행하였습니다. 이를 통해 SegNet이 다른 구조들에 비해 경쟁력 있는 추론 시간과 더 효율적인 메모리를 사용하면서 우수한 성능을 제공함을 보여주었습니다. 또한 SegNet의 Caffe 구현 및 웹 데모를 http://mi.eng.cam.ac.uk/projects/segnet/ 에서 제공하고 있습니다.

SegNet: 이미지 세그멘테이션을 위한 딥 컨볼루셔널 인코더-디코더 아키텍처 | 최신 연구 논문 | HyperAI초신경