2달 전

부분 순서 가지치기: 신경망 구조 탐색에서 최적의 속도/정확도 균형을 위한 방법

Xin Li; Yiming Zhou; Zheng Pan; Jiashi Feng
부분 순서 가지치기: 신경망 구조 탐색에서 최적의 속도/정확도 균형을 위한 방법
초록

타겟 플랫폼에서 좋은 속도와 정확도의 균형을 이루는 것은 실제 환경에서 딥 뉴럴 네트워크를 배포하는 데 매우 중요합니다. 그러나 대부분의 기존 자동 아키텍처 탐색 접근 방식은 고성능에만 집중하고 있습니다. 본 연구에서는 최적의 속도와 정확도 균형을 제공할 수 있는 "부분 순서 프루닝(Partial Order Pruning)" 알고리즘을 제안합니다. 이 알고리즘은 부분 순서 가정을 사용하여 아키텍처 탐색 공간을 줄여, 최적의 속도와 정확도 균형을 가진 아키텍처를 자동으로 탐색합니다. 제안된 알고리즘은 타겟 플랫폼에서 추론 속도에 대한 프로파일 정보를 명시적으로 고려합니다. 이 알고리즘을 통해 다양한 응용 GPU 플랫폼에서 높은 정확도와 빠른 추론 속도를 제공하는 여러 동풍(DF) 네트워크를 소개합니다. 또한 디코더 아키텍처를 더 깊이 탐색함으로써, 우리의 DF-Seg 실시간 세그멘테이션 네트워크는 타겟 임베디드 장치와 고급 GPU 모두에서 최신 수준의 속도/정확도 균형을 달성하였습니다.

부분 순서 가지치기: 신경망 구조 탐색에서 최적의 속도/정확도 균형을 위한 방법 | 최신 연구 논문 | HyperAI초신경