HyperAIHyperAI

Command Palette

Search for a command to run...

エッジクラウドコンピューティングにおけるコンテキストに配慮した深層モデル圧縮

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

概要

深層ニューラルネットワーク(DNN)は、パラダイムシフトをもたらした一方で、その膨大な計算リソース要求が、ウェアラブルデバイスやスマートフォンといったエッジデバイスへの展開を常に阻害してきました。そのため、ネットワーク状態が一定であるという仮定の下でDNN演算を単純に分割するという、ハイブリッドエッジ・クラウド計算フレームワークが提案されています。しかし、実世界におけるネットワーク状態は文脈によって大きく変動し、DNNの分割戦略は限定的なものにとどまります。本論文では、DNNの構造的柔軟性を活用し、変化するネットワーク環境や異なる展開プラットフォームに応じてエッジモデルを適応させる方法を検討します。具体的には、モデル精度と計算遅延という複合的な目的関数を考慮して、モデル変換戦略を探索する強化学習ベースの意思決定エンジンを設計しました。このエンジンは、状況に応じたモデルツリーを生成し、実行時においてDNNが適切なモデルブランチに切り替えることを可能にします。エミュレーションおよび実環境実験の結果、本手法はモデル精度を維持しつつ、遅延を30%~50%削減することを実証しました。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
エッジクラウドコンピューティングにおけるコンテキストに配慮した深層モデル圧縮 | 記事 | HyperAI超神経