15日前
ERQA:動画スーパーレゾリューションにおけるエッジ復元品質評価
Anastasia Kirillova, Eugene Lyapustin, Anastasia Antsiferova, Dmitry Vatolin

要約
ビデオスーパーレゾリューション(VSR)の普及が進む一方で、拡大されたフレームにおける復元された詳細情報の品質を評価する適切な手法は依然として存在しない。一部のSR手法は誤った数字を生成するか、まったく異なる顔を再現する可能性がある。ある手法の結果が信頼できるかどうかは、真実の詳細情報をいかに正確に復元できるかにかかっている。画像スーパーレゾリューションでは、自然な分布を用いることで、実際の画像とはある程度類似した高解像度画像を生成できるが、その精度には限界がある。一方、VSRは隣接するフレームに含まれる追加情報を活用することで、元のシーンからの詳細情報をより正確に復元することが可能となる。本論文で提案するERQA指標は、VSRを用いた際にモデルが真実の詳細情報をどれだけ正確に復元できるかを推定することを目的としている。エッジが詳細情報および識別に重要な役割を果たすという仮定のもと、本指標の基盤としてエッジ忠実度(edge fidelity)を採用した。本研究の実験的検証は、詳細復元において最も困難なパターンを含むMSUビデオスーパーレゾリューションベンチマークに基づいて行われ、元のフレームからの詳細情報の忠実度を検証している。提案する指標のコードは、https://github.com/msu-video-group/ERQA にて公開されている。