
초록
인간은 종종 이미지의 의미 내용을 식별하면서 그 이미지의 미적 품질을 평가합니다. 본 논문에서는 자동 미적 품질 평가와 의미 인식 간의 상관관계 문제를 다룹니다. 우리는 이 평가 문제를 다중 작업 딥 모델에서 주요 작업으로 설정하고, 의미 인식 작업이 이 문제 해결의 열쇠를 제공한다고 주장합니다. 컨볼루션 신경망을 기반으로, 우리는 미적 및 의미 라벨의 감독을 효율적으로 활용하기 위해 단일이고 간단한 다중 작업 프레임워크를 사용합니다. 또한 작업 간 관계 학습을 통합하여 이러한 두 작업 사이의 상관관계 항목을 프레임워크에 추가합니다. 이 항목은 상관관계에 대한 유용한 통찰력을 제공할 뿐만 아니라 미적 품질 평가 작업의 정확성을 개선합니다. 특히, 두 작업 간 균형을 유지하기 위한 효과적인 전략이 개발되어 프레임워크의 매개변수 최적화를 지원합니다. AVA 데이터셋과 Photo.net 데이터셋에서 수행된 광범위한 실험들은 의미 인식이 미적 품질 평가에서 중요한 역할을 함을 입증하며, 다중 작업 딥 모델이 최신 결과를 달성하기 위한 효과적인 미적 표현을 발견할 수 있음을 보여줍니다.