
要約
本稿では、動画のブラー除去に向けたシンプルかつ効果的な深層畳み込みニューラルネットワーク(CNN)モデルを提案する。提案手法は、中間潜在フレームからのオプティカルフロー推定と潜在フレームの復元という2つの主要なステップから構成される。まず、中間潜在フレームからオプティカルフローを推定するための深層CNNモデルを構築し、その後、推定されたオプティカルフローを基に潜在フレームを復元する。動画から得られる時間的情報をより効果的に活用するため、潜在フレームの復元を支援するべく、時間的鮮鋭性Prior(事前知識)を導入した。さらに、効果的なカスケード型トレーニングアプローチを設計し、提案したCNNモデルをエンドツーエンドで一括して最適化する。実験により、動画のブラー除去に関するドメイン知識を活用することで、深層CNNモデルの構造をよりコンパクトかつ効率的にすることができるという点を示した。広範な実験結果から、ベンチマークデータセットおよび実世界の動画において、提案手法が最先端の手法と比較しても優れた性能を発揮することが確認された。