
要約
本論文では、ジェネリック画像データベースから非監督学習アプローチを用いて得られたスパース表現を使用して、知覚的な画像品質を推定しています。空間的な冗長性を削減することで画像の説明力を向上させるために、色空間変換、平均値の引き算、およびホワイトニング操作が行われます。線形デコーダーはスパース表現を得るために使用され、閾値処理ステージは視覚システムにおける抑制メカニズムを定式化するために使用されます。線形デコーダーは、ImageNet 2013 データベースからほぼ 1,000 枚の画像に含まれる 100,000 個の 8x8 画像パッチをランダムに取得した約 7 GB のデータで訓練されました。局所情報を維持するため、パッチ単位での訓練アプローチが採用されています。提案された品質推定器 UNIQUE は、LIVE データベース、Multiply Distorted LIVE データベース、および TID 2013 データベースでテストされ、13 種類の品質推定器と比較されました。実験結果は、精度、一貫性、線形性、および単調性の観点で UNIQUE が一般的に最上位の性能を持つ品質推定器であることを示しています。