7日前

MUSIQ:マルチスケール画像品質変換器

Junjie Ke, Qifei Wang, Yilin Wang, Peyman Milanfar, Feng Yang
MUSIQ:マルチスケール画像品質変換器
要約

画像品質評価(Image Quality Assessment: IQA)は、視覚体験の理解と向上に向けた重要な研究テーマである。現在の最先端のIQA手法は、畳み込みニューラルネットワーク(Convolutional Neural Networks: CNN)に基づいている。しかし、CNNベースのモデルの性能は、バッチ学習における固定形状制約の影響を受けることが多く、これを回避するため、入力画像は通常、固定された形状にリサイズおよびクロップされる。このプロセスは画像品質の低下を引き起こす。こうした課題に対処するため、本研究では、サイズやアスペクト比が異なるネイティブ解像度の画像を処理可能なマルチスケール画像品質Transformer(MUSIQ)を提案する。本手法はマルチスケール表現を採用することで、画像品質を異なる粒度で捉えることが可能となる。さらに、マルチスケール表現における位置情報の埋め込みを支えるために、新規のハッシュベース2次元空間埋め込みとスケール埋め込みを導入している。実験結果により、本手法がPaQ-2-PiQ、SPAQ、KonIQ-10kといった複数の大規模IQAデータセットにおいて、最先端の性能を達成できることを確認した。

MUSIQ:マルチスケール画像品質変換器 | 最新論文 | HyperAI超神経