HyperAIHyperAI

Command Palette

Search for a command to run...

環境音分類のエッジデバイス実装:極めてリソース制約のあるデバイス向けの深層音響ネットワークパイプライン

Md Mohaimenuzzaman* Christoph Bergmeir Ian West Bernd Meyer

概要

極めて限られたリソース(メモリ、速度、GPUの非対応)を持つエッジデバイスに最先端の分類と認識機能を実装するため、多大な努力が払われています。本稿では、音響認識用の深層ネットワークとして初めて、小型で柔軟性があり圧縮に適したネットワークを提案し、その性能が生のオーディオ分類において最先端レベルであることを示します。単なる一回限りの解決策ではなく、大規模な深層畳み込みネットワークを圧縮と量子化を通じて自動的にリソースが制約されたエッジデバイス向けのネットワークに変換する汎用的なパイプラインを提示します。ACDNetについて紹介します。このネットワークはESC-10(96.65%)、ESC-50(87.10%)、UrbanSound8K(84.45%)、AudioEvent(92.57%)で最先端以上の精度を達成しています。次に、圧縮パイプラインについて説明し、これにより97.22%のサイズ削減と97.28%のFLOP削減を実現しながら、これらのデータセットでほぼ最先端の精度(96.25%、83.65%、78.27%、89.69%)を維持できることを示します。一般的な市販マイクロコントローラーでの成功した実装について述べるとともに、ラボベンチマークを超えて実世界データセットでの成功したテスト結果も報告します。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています