17日前
Raspberry Piにおける画像分類のための効率的な畳み込みニューラルネットワーク
Rui-Yang Ju, Ting-Yu Lin, Jia-Hao Jian, Jen-Shiun Chiang

要約
コンピュータビジョン(CV)分野における深層学習アルゴリズムの優れた性能に伴い、畳み込みニューラルネットワーク(CNN)アーキテクチャは、コンピュータビジョンタスクの主要なベースラインとして広く採用されている。一方、モバイルデバイスの普及に伴い、低計算能力を有するプラットフォーム上で動作するニューラルネットワークモデルに対する関心が高まっている。しかし、計算能力の制約により、従来の深層学習アルゴリズムは通常、モバイルデバイス上で実行が困難である。本研究では、ラズベリーパイ上で容易に動作可能な軽量畳み込みニューラルネットワーク「TripleNet」を提案する。ThreshNetにおけるブロック接続の概念を採用し、新しく提案されたこのネットワークモデルは、ネットワークの圧縮と高速化を実現し、パラメータ数を削減するとともに、各画像の推論時間を短縮しつつ、精度を維持することを可能にした。提案するTripleNetおよび他の最先端(SOTA)ニューラルネットワークを用いて、ラズベリーパイ上でCIFAR-10およびSVHNデータセットを用いた画像分類実験を実施した。実験結果から、GhostNet、MobileNet、ThreshNet、EfficientNet、HarDNetと比較して、TripleNetの1画像あたりの推論時間はそれぞれ15%、16%、17%、24%、30%短縮された。本研究の詳細なコードは、https://github.com/RuiyangJu/TripleNet にて公開されている。