
要約
視覚的品質の測定は、多数の画像および動画処理応用において根本的な重要性を有する。品質評価(QA)研究の目的は、人間の知覚に一貫性を持つ形で画像または動画の品質を自動的に評価できるアルゴリズムの設計にある。一般的に、画像QAアルゴリズムは、ある「参照画像」または「完璧な画像」との類似性、すなわち忠実度(fidelity)として画像品質を捉える。このような「フルリファレンス型」QA手法は、人間視覚系(HVS)の顕著な生理学的・心理視覚的特徴をモデル化するか、信号忠実度指標を用いることで、品質予測の一貫性を実現することを目指している。本論文では、画像QA問題を情報忠実度の問題として捉えるアプローチを提案する。具体的には、歪みプロセスによって損失する画像情報の量を定量化し、画像情報と視覚的品質との関係を検討する。QAシステムは、常に人間が消費を目的とした「自然な」画像や動画の視覚的品質を判断する作業に携わっている。研究者たちは、こうした自然信号の統計特性を捉えるための高度なモデルを構築してきた。これらのモデルを活用して、我々は以前、参照画像と歪み画像の間で共有される情報量と画像品質との関係を示す情報忠実度基準を提示した。本論文では、参照画像に含まれる情報量と、歪み画像からその参照情報のどれだけが復元可能かを定量化する画像情報測度を提案する。この二つの量を統合することで、画像QA用の視覚情報忠実度指標を構築する。本手法の性能は、779枚の画像を対象とした包括的な主観評価実験により検証され、シミュレーションにおいて近年の最先端画像QAアルゴリズムを明確に上回ることを示した。本研究のコードおよび主観評価実験のデータは、LIVEウェブサイトにて公開されている。