
要約
既存の画像間変換(I2IT)手法は、高解像度特徴マップの畳み込みに伴う重い計算負荷により、低解像度画像への制約または長い推論時間のいずれかに陥っています。本論文では、閉形式ラプラシアンピラミッド分解と再構成に基づく高解像度写実的なI2ITタスクの高速化に焦点を当てます。具体的には、照明や色操作などの属性変換が低周波成分とより密接に関連している一方で、コンテンツの詳細は高周波成分上で適応的に精緻化できることを示します。これに基づいて、我々はこれらの2つのタスクを同時に実行するためのラプラシアンピラミッド変換ネットワーク(LPTN)を提案します。ここで、低周波成分の変換には解像度を低下させた軽量なネットワークを設計し、高周波成分の効率的な精緻化には段階的なマスキング戦略を採用しています。当モデルは高解像度特徴マップ処理による大部分の重い計算を回避しつつ、画像の詳細を忠実に保つことができます。様々なタスクに対する広範な実験結果から、提案手法は一般的なGPU1枚を使用して4K画像をリアルタイムで変換可能であり、既存手法と同等の変換性能を達成することが確認されました。データセットとコードは以下のURLから入手可能です: https://github.com/csjliang/LPTN.