
要約
大規模な実際のRAW画像ノイズ除去データセットの不足により、学習用に現実的なRAW画像ノイズを合成するという課題が生じている。しかし、実際のRAW画像ノイズは多数のノイズ源に起因しており、異なるセンサー間で著しく変動する。従来の手法はすべてのノイズ源を正確にモデル化できず、各センサーごとにノイズモデルを構築することも人的負荷が非常に高い。本論文では、センサーの実際のノイズから直接サンプリングするという新たなアプローチを提案する。これにより、異なるカメラセンサーに対して本質的に正確なRAW画像ノイズを生成可能となる。空間相関ノイズの正確な合成を実現するための「パターン整合型パッチサンプリング」と、高ビットノイズの再構成を可能にする「高ビット再構成」という、2つの効率的かつ汎用的な技術を導入している。本研究ではSIDDおよびELDデータセットを用いて系統的な実験を実施した結果、(1)本手法は既存手法を上回り、異なるセンサーおよび照明条件下において広範な一般化性能を示した。(2)近年のDNNに基づくノイズモデル化手法から得られた結論の多くは、実際のノイズパラメータの不正確さに起因していることが明らかになった。DNNベースの手法は依然として、物理ベースの統計的手法を上回ることはできていない。