11日前

UGC-VQA:ユーザ生成コンテンツ向け盲目的動画品質評価のベンチマーク

Zhengzhong Tu, Yilin Wang, Neil Birkbeck, Balu Adsumilli, Alan C. Bovik
UGC-VQA:ユーザ生成コンテンツ向け盲目的動画品質評価のベンチマーク
要約

近年、安価かつ信頼性の高い消費者用映像撮影デバイスの進化と、ソーシャルメディアプラットフォームの爆発的な人気により、ユーザー生成コンテンツ(UGC)動画のインターネット上での共有・配信が急増している。このような状況に伴い、こうした膨大なUGC/消費者向け動画の品質を監視・制御・最適化するため、高精度な動画品質評価(VQA)モデルの開発が強く求められている。特に、実環境(in-the-wild)における動画のブラインド品質予測は、UGCコンテンツの品質劣化が予測不可能であり、複雑かつしばしば複合的に混在しているため、極めて困難である。本研究では、固定された評価アーキテクチャ上で最先端の非参照/ブラインドVQA(BVQA)特徴量およびモデルを包括的に評価することで、UGC-VQA問題の前進に貢献した。さらに、最先端のVQAモデルが使用する763個の統計特徴量のうち、特徴選択戦略を適用して60個を抽出し、新たな統合型BVQAモデルを構築した。このモデルを「VIDeo quality EVALuator(VIDEVAL)」と命名し、VQA性能と効率性の間のトレードオフを効果的にバランスさせることに成功した。実験結果から、VIDEVALは他の最先端モデルと比較して、はるかに低い計算コストで最先端の性能を達成することが明らかになった。本研究のプロトコルは、UGC-VQA問題に対する信頼性の高いベンチマークを定義しており、深層学習に基づくVQAモデリングや、人間の知覚に配慮した効率的なUGC動画処理・変換・ストリーミングに関する今後の研究を促進すると考えられる。再現性の高い研究と公開評価を推進するため、VIDEVALの実装コードをオンライン上で公開している:\url{https://github.com/tu184044109/VIDEVAL_release}。

UGC-VQA:ユーザ生成コンテンツ向け盲目的動画品質評価のベンチマーク | 最新論文 | HyperAI超神経