2달 전

환경 소리 분류: 극도로 자원이 제한된 장치에서의 깊은 음향 네트워크 파이프라인

Mohaimenuzzaman, Md ; Bergmeir, Christoph ; West, Ian Thomas ; Meyer, Bernd
환경 소리 분류: 극도로 자원이 제한된 장치에서의 깊은 음향 네트워크 파이프라인
초록

극히 제한된 자원(메모리, 속도, GPU 지원 부족)을 가진 엣지 디바이스에 최신의 분류 및 인식 기술을 도입하기 위해 많은 노력이 투자되고 있습니다. 본 연구에서는 원시 오디오 분류에서 최고 수준의 성능을 달성하면서도 작고, 유연하며, 압축에 적합한 첫 번째 딥 네트워크를 소개합니다. 일회용 솔루션을 수작업으로 설계하는 대신, 우리는 큰 딥 컨볼루셔널 네트워크를 압축 및 양자화를 통해 자원이 부족한 엣지 디바이스용 네트워크로 자동 변환하는 일반적인 파이프라인을 제시합니다.ACDNet을 소개하는데, 이는 ESC-10(96.65%), ESC-50(87.10%), UrbanSound8K(84.45%), AudioEvent(92.57%) 데이터셋에서 최고 수준의 정확도를 초과하여 달성하였습니다. 이후 압축 파이프라인을 설명하고, 이 파이프라인이 데이터셋에서 각각 96.25%, 83.65%, 78.27%, 89.69%의 정확도를 유지하면서 97.22%의 크기 축소와 97.28%의 FLOP(Floating Point Operations per Second) 축소를 가능하게 한다는 점을 보여드립니다.우리는 표준 오프더shelf 마이크로컨트롤러에서 성공적인 구현 사례를 설명하며, 실험실 벤치마크 이상으로 실제 세계 데이터셋에서도 성공적인 테스트 결과를 보고합니다.

환경 소리 분류: 극도로 자원이 제한된 장치에서의 깊은 음향 네트워크 파이프라인 | 최신 연구 논문 | HyperAI초신경