2달 전

세마틱 세그멘테이션을 위한 완전 컨볼루셔널 네트워크

Jonathan Long; Evan Shelhamer; Trevor Darrell
세마틱 세그멘테이션을 위한 완전 컨볼루셔널 네트워크
초록

컨벌루션 네트워크는 강력한 시각 모델로, 피처의 계층 구조를 생성합니다. 본 연구에서는 컨벌루션 네트워크가 자체적으로, 엔드투엔드 방식으로, 픽셀 대 픽셀로 훈련되었을 때 의미 분할에서 최신 기술을 초월한다는 것을 보여줍니다. 우리의 핵심 통찰은 임의의 크기의 입력을 받아 효율적인 추론과 학습으로 동일한 크기의 출력을 생성하는 "완전 컨벌루션" 네트워크를 구축하는 것입니다. 우리는 완전 컨벌루션 네트워크의 공간을 정의하고 상세히 설명하며, 이들의 공간적으로 밀집된 예측 작업에 대한 적용 방법과 이전 모델들과의 연결성을 설명합니다. 현대적인 분류 네트워크(AlexNet, VGG 넷, GoogLeNet)를 완전 컨벌루션 네트워크로 변환하고 세그멘테이션 작업에 대한 미세 조정(fine-tuning)을 통해 그들이 학습한 표현을 전송합니다. 그런 다음 깊고 거친 층에서 얻은 의미 정보와 얕고 섬세한 층에서 얻은 외관 정보를 결합하여 정확하고 상세한 세그멘테이션을 생성하는 새로운 아키텍처를 정의합니다. 우리의 완전 컨벌루션 네트워크는 PASCAL VOC(2012년 데이터셋에서 평균 IU 62.2%로 20% 상대적 개선), NYUDv2, 그리고 SIFT Flow에서 최신 기술 수준의 세그멘테이션 성능을 달성하며, 일반 이미지에 대한 추론 시간은 약 0.3초입니다.

세마틱 세그멘테이션을 위한 완전 컨볼루셔널 네트워크 | 최신 연구 논문 | HyperAI초신경