MFQE 2.0: 圧縮ビデオのマルチフレーム品質向上の新アプローチ

過去数年間、深層学習を用いて圧縮された画像や動画の品質向上に大きな成功が見られました。既存の手法は主に単一フレームの品質向上に焦点を当てており、連続するフレーム間の類似性を考慮していません。本論文で調査したように、圧縮動画のフレーム間には大きな変動が存在します。そのため、近接する高品質フレームを基にして低品質フレームの品質向上を行う際、フレーム類似性を利用することができます。このタスクはマルチフレーム品質向上(Multi-Frame Quality Enhancement: MFQE)と呼ばれます。本論文では、この方向性における最初の試みとして、圧縮動画向けのMFQE手法を提案します。当手法ではまず、双方向長短期記憶(Bidirectional Long Short-Term Memory: BiLSTM)に基づく検出器を開発し、圧縮動画中のピーク品質フレーム(Peak Quality Frames: PQFs)を特定します。次に、非PQFとその最も近い2つのPQFを入力とする新しいマルチフレーム畳み込みニューラルネットワーク(Multi-Frame Convolutional Neural Network: MF-CNN)を設計しました。MF-CNNにおいては、非PQFとPQF間の動きを運動補償サブネットによって補正します。その後、品質向上サブネットが非PQFと補正されたPQFを融合し、非PQFの圧縮アーティファクトを軽減します。また、同様の方法でPQFの品質も向上させます。最後に、実験結果により当MFQE手法が最新技術を超える効果性と汎化能力を持つことが確認されました。コードは以下のURLから入手可能です:https://github.com/RyanXingQL/MFQEv2.0.git