HyperAIHyperAI

Command Palette

Search for a command to run...

RNNPool:RAM制約下での効率的な非線形プーリング

Oindrila Saha Aditya Kusupati Harsha Vardhan Simhadri Manik Varma Prateek Jain

概要

コンピュータビジョンタスクに特化した標準的な畳み込みニューラルネットワーク(CNN)は、通常、大きな中間活性化マップを生成する傾向がある。このようなマップは大きな作業メモリを必要とし、エッジにおける推論に一般的に用いられるリソース制約の厳しいデバイスへの展開には不適切である。プーリングやストライド付き畳み込みによる過度なダウンサンプリングによりこの問題に対処できるが、標準的なプーリング演算子による特徴マップの粗い集約によって、精度が著しく低下するという問題が生じる。本論文では、再帰型ニューラルネットワーク(RNN)に基づく新しいプーリング演算子「RNNPool」を提案する。RNNPoolは、画像の大規模な領域にわたる特徴を効率的に集約し、活性化マップを迅速にダウンサンプリングする能力を持つ。実証的な評価結果から、RNNPool層はMobileNetやDenseNetなどの多様なアーキテクチャにおいて、画像分類や顔検出といった標準的なビジョンタスクにおいて複数のブロックを効果的に置き換えることが示された。すなわち、RNNPoolを用いることで、推論時の計算複雑度とピークメモリ使用量を大幅に削減しつつ、同等の精度を維持できる。本研究では、標準的なS3FDアーキテクチャにRNNPoolを組み合わせ、RAM容量が256KB未満の小型ARM Cortex-M4クラスのマイコン上で最先端のMAP性能を達成する顔検出手法を構築した。コードは https://github.com/Microsoft/EdgeML にて公開されている。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
RNNPool:RAM制約下での効率的な非線形プーリング | 記事 | HyperAI超神経