2 个月前

多级空间池化特征的有效美学预测

Hosu, Vlad ; Goldlucke, Bastian ; Saupe, Dietmar
多级空间池化特征的有效美学预测
摘要

我们提出了一种有效的深度学习方法来评估美学质量,该方法依赖于一种新的预训练特征类型,并将其应用于目前最大的美学数据库——AVA数据集。以往的方法在训练过程中由于对原始图像进行小范围裁剪、缩放或变形,导致丢失了部分原始图像的信息。为此,我们提出了首个能够高效支持全分辨率图像输入并在不同输入尺寸上进行训练的方法。这使得我们在现有最佳报告结果的基础上显著提升了性能,将基于真实值的平均意见得分(MOS)的Spearman等级相关系数(SRCC)从0.612提高到0.756。为了达到这一性能,我们从预训练的InceptionResNet-v2网络的所有卷积块中提取多级空间池化(MLSP)特征,并在此基础上训练了一个自定义的浅层卷积神经网络(CNN)架构。