Command Palette
Search for a command to run...
エッジクラウドコンピューティングにおけるコンテキストに配慮した深層モデル圧縮
エッジクラウドコンピューティングにおけるコンテキストに配慮した深層モデル圧縮
Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang
概要
深層ニューラルネットワーク(DNN)は、パラダイムシフトをもたらした一方で、その膨大な計算リソース要求が、ウェアラブルデバイスやスマートフォンといったエッジデバイスへの展開を常に阻害してきました。そのため、ネットワーク状態が一定であるという仮定の下でDNN演算を単純に分割するという、ハイブリッドエッジ・クラウド計算フレームワークが提案されています。しかし、実世界におけるネットワーク状態は文脈によって大きく変動し、DNNの分割戦略は限定的なものにとどまります。本論文では、DNNの構造的柔軟性を活用し、変化するネットワーク環境や異なる展開プラットフォームに応じてエッジモデルを適応させる方法を検討します。具体的には、モデル精度と計算遅延という複合的な目的関数を考慮して、モデル変換戦略を探索する強化学習ベースの意思決定エンジンを設計しました。このエンジンは、状況に応じたモデルツリーを生成し、実行時においてDNNが適切なモデルブランチに切り替えることを可能にします。エミュレーションおよび実環境実験の結果、本手法はモデル精度を維持しつつ、遅延を30%~50%削減することを実証しました。