2ヶ月前

環境音分類のエッジデバイス実装:極めてリソース制約のあるデバイス向けの深層音響ネットワークパイプライン

Mohaimenuzzaman, Md ; Bergmeir, Christoph ; West, Ian Thomas ; Meyer, Bernd
環境音分類のエッジデバイス実装:極めてリソース制約のあるデバイス向けの深層音響ネットワークパイプライン
要約

極めて限られたリソース(メモリ、速度、GPUの非対応)を持つエッジデバイスに最先端の分類と認識機能を実装するため、多大な努力が払われています。本稿では、音響認識用の深層ネットワークとして初めて、小型で柔軟性があり圧縮に適したネットワークを提案し、その性能が生のオーディオ分類において最先端レベルであることを示します。単なる一回限りの解決策ではなく、大規模な深層畳み込みネットワークを圧縮と量子化を通じて自動的にリソースが制約されたエッジデバイス向けのネットワークに変換する汎用的なパイプラインを提示します。ACDNetについて紹介します。このネットワークはESC-10(96.65%)、ESC-50(87.10%)、UrbanSound8K(84.45%)、AudioEvent(92.57%)で最先端以上の精度を達成しています。次に、圧縮パイプラインについて説明し、これにより97.22%のサイズ削減と97.28%のFLOP削減を実現しながら、これらのデータセットでほぼ最先端の精度(96.25%、83.65%、78.27%、89.69%)を維持できることを示します。一般的な市販マイクロコントローラーでの成功した実装について述べるとともに、ラボベンチマークを超えて実世界データセットでの成功したテスト結果も報告します。

環境音分類のエッジデバイス実装:極めてリソース制約のあるデバイス向けの深層音響ネットワークパイプライン | 最新論文 | HyperAI超神経