15日前

動的モデリングの再検討:動画スーパーアンプルングへ

Takashi Isobe, Fang Zhu, Xu Jia, Shengjin Wang
動的モデリングの再検討:動画スーパーアンプルングへ
要約

動画スーパーレゾリューション(VSR)は監視映像解析および超高精細映像表示において重要な役割を果たしており、研究界および産業界の両方から注目を集めている。多くの深層学習ベースのVSR手法が提案されてきたものの、異なる損失関数や学習データセットが超解像結果に顕著な影響を及ぼすため、これらの手法を直接比較することは困難である。本研究では、動画スーパーレゾリューションに向けた3つの時間的モデリング手法(2D CNNによる早期融合、3D CNNによるスローフュージョン、再帰型ニューラルネットワーク)について、詳細に検討および比較を行った。さらに、再帰型残差ネットワーク(RRN)を提案し、再帰型ネットワークの学習安定化と同時に超解像性能の向上を実現するため、残差学習を活用した。広範な実験結果から、提案手法RRNは高い計算効率を示し、他の時間的モデリング手法と比較して、より細部が豊かで時間的に一貫性のあるVSR結果を生成することが明らかになった。また、多数の広く用いられているベンチマークにおいて、最先端の性能を達成した。

動的モデリングの再検討:動画スーパーアンプルングへ | 最新論文 | HyperAI超神経