
초록
우리는 효과적인 딥 러닝 접근 방식을 제안하여 미적 품질 평가를 수행하며, 이를 현재까지 가장 큰 미적 데이터베이스인 AVA 데이터셋에 적용합니다. 기존의 접근 방식들은 훈련 과정에서 원본 이미지를 작은 부분으로 자르거나 축소하거나 왜곡함으로써 원본 이미지의 일부 정보를 놓치는 반면, 우리는 전체 해상도 이미지를 효율적으로 지원하는 첫 번째 방법을 제안합니다. 이 방법은 다양한 입력 크기로 훈련될 수 있어, 기존 최고 성능(0.612)보다 크게 개선되어 지표 평균 의견 점수(MOS)의 스피어만 순위 상관계수(SRCC)를 0.756까지 끌어올릴 수 있습니다. 이러한 성능을 달성하기 위해, 사전 학습된 InceptionResNet-v2 네트워크의 모든 컨볼루션 블록에서 다중 수준 공간 풀링(MLSP) 특성을 추출하고, 이 새로운 특성을 바탕으로 사용자 정의 얕은 컨볼루션 신경망(CNN) 구조를 훈련시킵니다.