2ヶ月前

効果的な美的予測のための多段階空間プーリング特徴量

Hosu, Vlad ; Goldlucke, Bastian ; Saupe, Dietmar
効果的な美的予測のための多段階空間プーリング特徴量
要約

私たちは、美的品質評価に有効な深層学習アプローチを提案し、そのアプローチを現在最大の美的データベースであるAVAデータセットに適用します。従来のアプローチでは、訓練時に小さな切り出しや縮小、または元画像の歪みを行うため、元画像の情報が一部失われていましたが、私たちは初めてフル解像度の画像を効率的にサポートし、可変入力サイズで訓練できる方法を提案します。これにより、地上真平均意見スコア(MOS)のスピアマン順位相関係数(SRCC)を既存の最高報告値0.612から0.756へと大幅に向上させることができます。この性能を達成するために、事前学習されたInceptionResNet-v2ネットワークのすべての畳み込みブロックから多段階空間プーリング(MLSP)特徴量を抽出し、これらの新しい特徴量に基づいてカスタム浅層畳み込みニューラルネットワーク(CNN)アーキテクチャを訓練します。