11日前
KonIQ-10k:ブラインド画像品質評価のためのディープラーニングにおける生態学的に妥当なデータベース
Vlad Hosu, Hanhe Lin, Tamas Sziranyi, Dietmar Saupe

要約
画像品質評価(IQA)におけるディープラーニング手法は、既存のデータセットの規模が小さいことにより限界に直面している。大規模なデータセットの構築には、公開可能なコンテンツの生成と正確なラベリングの両面で膨大なリソースが必要となる。本研究では、これまでで最大規模となる10,073枚の品質スコア付き画像を含む「KonIQ-10k」というデータセットの構築に向け、体系的かつスケーラブルなアプローチを提案する。これは、歪みの現実性、コンテンツの多様性、品質関連指標の観点から生態学的妥当性(ecological validity)を重視した、初めての「野外実態(in-the-wild)」データベースである。クラウドソーシングを活用することで、1,459名の作業者から合計120万件の信頼性の高い品質評価を得た。これにより、より汎用性の高いIQAモデルの開発が可能となる。さらに、本研究では、InceptionResNetアーキテクチャを基盤とし、従来のモデルよりも高い解像度(512×384)で学習された新規ディープラーニングモデル「KonCept512」を提案する。このモデルは、テストセット外での優れた汎化性能を示し、SROCC(順位相関係数)で0.921を達成。これは、現在の最先端データベースであるLIVE-in-the-Wildにおいて0.825のSROCCを上回る成果である。相関分析の結果、KonCept512は各テスト画像に対して9つの主観的評価値がある場合と同等の性能を発揮することが明らかになった。