20日前
COMISR:圧縮情報に基づく動画スーパーレゾリューション
Yinxiao Li, Pengchong Jin, Feng Yang, Ce Liu, Ming-Hsuan Yang, Peyman Milanfar

要約
多くの動画スーパーレゾリューション手法は、低解像度動画から高解像度動画フレームを復元することに焦点を当てており、圧縮の影響を考慮していない。しかし、Webやモバイルデバイス上の大多数の動画は圧縮されている上、帯域が制限される状況では圧縮が顕著になる。本論文では、圧縮によって生じるアーティファクトを引き起こさずに高解像度コンテンツを復元できる、新たな「圧縮情報を考慮した動画スーパーレゾリューションモデル」を提案する。本モデルは、動画スーパーレゾリューションのための3つのモジュールから構成されている:双方向再帰的ワーピング、詳細保持型フロー推定、ラプラシアン強調。これらの3つのモジュールは、入力におけるイントラフレームの位置や出力フレームの滑らかさといった圧縮の特性に対処することを目的として設計されている。性能評価の徹底的実施のため、幅広い圧縮率をカバーする標準データセット上で多数の実験を実施した。その結果、広く用いられるベンチマークデータセットにおける非圧縮フレームから高解像度コンテンツを復元できるだけでなく、多数の定量的指標に基づいて、圧縮済み動画のスーパーレゾリューションにおいて最先端の性能を達成することが示された。さらに、YouTubeからのストリーミングをシミュレートすることで、本手法の有効性とロバスト性を評価した。ソースコードおよび学習済みモデルは、https://github.com/google-research/google-research/tree/master/comisr にて公開されている。