Command Palette
Search for a command to run...
A-Lamp:適応型レイアウト認識マルチパッチ深層畳み込みニューラルネットワークによる写真の美的評価
A-Lamp:適応型レイアウト認識マルチパッチ深層畳み込みニューラルネットワークによる写真の美的評価
Ma Shuang Liu Jing Chen Chang Wen
概要
近年、深層畳み込みニューラルネットワーク(CNN)は、写真の美的評価において有望な結果を示している。しかし、これらの深層CNN手法の性能は、ニューラルネットワークが固定サイズの入力しか受け付けないという制約によってしばしば低下する。この制約に対応するため、入力画像に対して切り取り(cropping)、変形(warping)、パディングなどの処理が必要となるが、これらは画像の構成を変更したり、解像度を低下させたり、歪みを生じさせたりする場合がある。その結果、細部のディテールや全体的な画像レイアウトが損なわれ、元の画像の美的価値が低下してしまう。しかし、このような細部のディテールと全体的な画像レイアウトは、画像の美的評価において極めて重要である。本論文では、写真の美的評価を目的とした、適応型レイアウト認識マルチパッチ畳み込みニューラルネットワーク(A-Lamp CNN)を提案する。この新規アーキテクチャは、任意サイズの画像を入力として受け入れることができ、同時に細部のディテールと全体的な画像レイアウトの両方から学習が可能である。これらのハイブリッドな入力データを用いた学習を可能にするために、マルチパッチサブネットとレイアウト認識サブネットという特化した二重サブネット構造を導入した。さらに、これらの二つのサブネットから得られるハイブリッド特徴量を効果的に統合するためのアグリゲーション層を構築した。大規模な美的評価ベンチマーク(AVA)を用いた広範な実験により、従来の最先端手法と比較して顕著な性能向上が確認された。