17日前

実世界における動画のぼやけ除去:ベンチマークデータセットと効率的な再帰型ニューラルネットワーク

Zhihang Zhong, Ye Gao, Yinqiang Zheng, Bo Zheng, Imari Sato
実世界における動画のぼやけ除去:ベンチマークデータセットと効率的な再帰型ニューラルネットワーク
要約

リアルタイムでのリアルワールド動画のブラー除去は、空間的・時間的に変化するブラーの複雑さと、低計算コストを要求する点から依然として挑戦的な課題である。ネットワークの効率を向上させるために、本研究ではRNNセルに残差密接続ブロック(residual dense blocks)を導入し、現在のフレームの空間特徴を効率的に抽出する。さらに、過去および未来のフレームから得られる有効な階層的特徴を統合するため、グローバルな空間時系列アテンションモジュールを提案する。これにより、現在のフレームのより高品質なブラー除去が可能となる。また、緊急に解決すべき課題として、リアルワールドのベンチマークデータセットの不足がある。そこで、共軸ビームスプリッターを用いた取得システムにより、ぼやけた映像と鮮明な映像のペアを収集し、コミュニティに新たなデータセット(BSD)を提供する。実験結果から、提案手法(ESTRNN)は、最先端の動画ブラー除去手法と比較して、定量的・定性的な両面で優れた性能を発揮するとともに、計算コストを低減していることが明らかになった。さらに、異なるデータセット間での交差検証実験により、BSDが合成データセットに対して高い汎用性を有していることが示された。コードおよびデータセットは、https://github.com/zzh-tech/ESTRNN にて公開されている。

実世界における動画のぼやけ除去:ベンチマークデータセットと効率的な再帰型ニューラルネットワーク | 最新論文 | HyperAI超神経