2달 전

해상도 인식 아트루스 비율 설계를 위한 의미 분할 네트워크

Bum Jun Kim; Hyeyeon Choi; Hyeonah Jang; Sang Woo Kim
해상도 인식 아트루스 비율 설계를 위한 의미 분할 네트워크
초록

DeepLab은 의미 분할을 위한 널리 사용되는 딥 뉴럴 네트워크로, 그 성공은 atrous spatial pyramid pooling (ASPP)이라는 병렬 아키텍처에 기인합니다. ASPP는 다양한 atrous rate를 가진 여러 atrous convolution을 사용하여 로컬 및 글로벌 정보를 추출합니다. 그러나 ASPP 모듈에서는 고정된 atrous rate 값을 사용하므로 이는 시야 범위의 크기를 제한하게 됩니다. 원칙적으로, atrous rate는 대상 작업이나 데이터셋에 따라 시야 범위의 크기를 조정하는 하이퍼파라미터여야 합니다. 하지만, atrous rate 조작에 대한 어떠한 지침도 존재하지 않습니다. 본 연구에서는 최적의 atrous rate를 얻기 위한 실용적인 지침을 제안합니다. 첫째, 의미 분할을 위한 효과적인 수용 영역(effective receptive field)을 도입하여 분할 네트워크의 내부 동작을 분석하였습니다. ASPP 모듈 사용이 효과적인 수용 영역에서 특정 패턴을 생성함을 관찰하였으며, 이를 추적하여 모듈의 근본 메커니즘을 밝혀냈습니다. 이에 따라, 입력 이미지의 크기에 따라 제어되어야 하는 최적의 atrous rate를 얻기 위한 실용적인 지침을 도출하였습니다. 다른 값들과 비교했을 때, 최적의 atrous rate를 사용하면 STARE, CHASE_DB1, HRF, Cityscapes 및 iSAID 데이터셋 등 여러 데이터셋에서 일관되게 분할 결과가 개선되었습니다.

해상도 인식 아트루스 비율 설계를 위한 의미 분할 네트워크 | 최신 연구 논문 | HyperAI초신경