
要約
本稿では、フル解像度の画像に簡単に適用可能なシンプルかつ汎用的な画像ハーモナイゼーション手法であるPCT-Netを提案する。本手法の核となるアイデアは、ダウンサンプリングされた入力画像を用いて、ピクセル単位の色変換(PCT: Pixel-wise Color Transforms)に用いるパラメータを予測するパラメータネットワークを学習することである。この予測されたパラメータを用いて、フル解像度画像の各ピクセルに色変換を適用することで、高精度なハーモナイゼーションを実現する。我々は、アフィン色変換が効率的かつ有効であることを示し、最先端のハーモナイゼーション性能を達成することを確認した。さらに、パラメータネットワークとしてCNNとTransformerの両方を検討した結果、Transformerの方が優れた結果をもたらすことを示した。公開のフル解像度iHarmony4データセット(4つのサブデータセットから構成)を用いた評価において、前景のMSE(fMSE)と全体のMSEが20%以上低下し、PSNR値が1.4dB向上する結果が得られた一方で、アーキテクチャは軽量なまま維持された。20名の被験者を対象としたユーザー研究においても、本手法は他の2つの最新手法よりも高いB-Tスコアを達成した。