2달 전

HarDNet: 저 메모리 트래픽 네트워크

Ping Chao; Chao-Yang Kao; Yu-Shan Ruan; Chien-Hsiang Huang; Youn-Long Lin
HarDNet: 저 메모리 트래픽 네트워크
초록

최신 신경망 구조인 ResNet, MobileNet, 및 DenseNet은 저 MACs(곱셈-누적 연산)와 작은 모델 크기의 대안들보다 뛰어난 정확도를 달성하였습니다. 그러나 이러한 지표들이 추론 시간을 예측하는 데 정확하지 않을 수 있습니다. 우리는 중간 특징 맵에 접근하기 위한 메모리 트래픽이 특히 고해상도 비디오의 실시간 객체 검출 및 의미 분할과 같은 작업에서 추론 지연 시간을 주도하는 요소일 수 있다고 제안합니다. 우리는 저 MACs와 메모리 트래픽 측면에서 높은 효율성을 달성하기 위해 조화롭게 밀집 연결된 네트워크(Harmonic Densely Connected Network)를 제안합니다. 이 새로운 네트워크는 FC-DenseNet-103, DenseNet-264, ResNet-50, ResNet-152, 그리고 SSD-VGG와 비교하여 각각 35%, 36%, 30%, 32%, 45%의 추론 시간 감소를 이루어냈습니다. 우리는 Nvidia 프로파일러 및 ARM Scale-Sim 도구를 사용하여 메모리 트래픽을 측정하고, 추론 지연 시간이 실제로 메모리 트래픽 소비량과 비례하며 제안된 네트워크가 낮은 메모리 트래픽을 소비함을 확인하였습니다. 우리는 고해상도 애플리케이션을 엣지 컴퓨팅 환경에서 설계할 때 메모리 트래픽을 고려해야 함을 결론으로 내립니다.

HarDNet: 저 메모리 트래픽 네트워크 | 최신 연구 논문 | HyperAI초신경