
要約
従来の物理ベースのポートレート画像再照明手法は、顔の幾何構造、反射特性、照明条件を推定する逆レンダリング問題を解く必要がある。しかし、顔の各要素の推定が不正確であると、再照明画像に顕著なアーティファクトが生じ、満足のいく結果に至らないことがある。本研究では、物理ベースのポートレート再照明手法を用いて、大規模かつ高品質な「リアル世界」のポートレート再照明データセット(DPR)を構築した。その後、このデータセットを用いて深層畳み込みニューラルネットワーク(CNN)を学習させ、入力として元画像と目標照明を与えることで、再照明されたポートレート画像を生成する。学習プロセスにより、物理ベース再照明手法に起因するアーティファクトが抑制され、生成結果の品質が向上する。さらに、生成对抗ネットワーク(GAN)損失を導入することで、再照明画像の視覚的品質をさらに向上させた。訓練されたネットワークは、解像度1024×1024までのポートレート画像に対しても再照明処理が可能である。提案手法は、自ら提案したDPRデータセットおよびFlickrポートレートデータセット、Multi-PIEデータセットにおいて、定性的・定量的に評価を行った。実験の結果、本手法が最先端の性能を達成していることが示された。データセットおよびコードについては、https://zhhoper.github.io/dpr.html をご参照ください。