UGC-VQA: 사용자 생성 콘텐츠를 위한 맹목적 비디오 품질 평가 벤치마킹

최근 들어, 저렴하고 신뢰할 수 있는 소비자용 캡처 장치의 발전과 소셜미디어 플랫폼의 폭발적 인기로 인해 사용자 생성 콘텐츠(UGC) 영상이 인터넷을 통해 급격히 증가하고 있다. 이에 따라, 이러한 방대한 UGC/소비자 영상 콘텐츠를 모니터링하고 제어하며 최적화하기 위해 정확한 영상 품질 평가(VQA) 모델에 대한 수요가 매우 높아지고 있다. 특히 실외 환경에서 촬영된 영상의 블라인드 품질 예측은 매우 도전적인 과제이며, 이는 UGC 콘텐츠의 품질 저하가 예측 불가능하고 복잡하며 종종 혼합되어 나타나기 때문이다. 본 연구에서는 고정된 평가 아키텍처에서 최첨단 비참조/블라인드 VQA(BVQA) 특징과 모델을 포괄적으로 평가함으로써 UGC-VQA 문제 해결에 기여한다. 이를 통해 주관적 영상 품질 연구와 VQA 모델 설계에 대한 새로운 경험적 통찰을 도출하였다. 선도적인 VQA 모델에서 사용하는 763개의 통계적 특징 중에서 특징 선택 전략을 적용하여 60개의 특징만을 추출함으로써, 성능과 효율성 사이의 균형을 효과적으로 조율하는 새로운 융합형 블라인드 VQA 모델을 개발하였다. 이 모델은 \textbf{VID}eo quality \textbf{EVAL}uator(VIDEVAL)라 명명하였다. 실험 결과, VIDEVAL은 다른 선도적인 모델들에 비해 훨씬 낮은 계산 비용으로 최첨단 성능을 달성함을 입증하였다. 또한 본 연구의 평가 프로토콜은 UGC-VQA 문제에 대한 신뢰할 수 있는 벤치마크를 정의하며, 이는 딥러닝 기반 VQA 모델링 및 인지적 최적화된 효율적인 UGC 영상 처리, 변환, 스트리밍 기술에 대한 향후 연구 발전을 촉진할 것으로 기대된다. 재현 가능한 연구와 공개 평가를 촉진하기 위해 VIDEVAL의 구현체가 온라인으로 공개되었으며, 해당 링크는 \url{https://github.com/tu184044109/VIDEVAL_release}이다.