
要約
画像変換問題について考察します。この問題では、入力画像が出力画像に変換されます。このような問題に対する最近の手法は、一般的に、出力画像と正解画像との間の\emph{画素単位}損失を使用して畳み込みニューラルネットワークを前向きフィードフォワード型で学習します。並行研究では、事前学習済みネットワークから抽出された高次特徴に基づいて定義および最適化された\emph{知覚的}損失関数を使用することで、高品質な画像を生成できることが示されています。両方のアプローチの利点を組み合わせ、画像変換タスク向けの前向きフィードフォワード型ネットワークの学習に知覚的損失関数を使用することを提案します。画像スタイル転送における結果を示します。ここで、前向きフィードフォワード型ネットワークは、Gatysらが提案した最適化問題をリアルタイムで解くように学習されます。最適化ベースの方法と比較して、当社のネットワークは同様の質的な結果を与えますが、その速度は3桁速くなります。また、単一画像超解像にも実験を行い、画素単位損失を知覚的損失に置き換えることで視覚的に魅力的な結果を得られることを確認しました。