
초록
우리는 왜곡 유형에 구애받지 않는 비디오 품질 평가 모델을 제안한다. 이 모델은 이산 코사인 변환(DCT) 영역에서 비디오 장면의 공간-시간 모델과 장면 내에서 발생하는 움직임의 유형을 특징화하는 모델에 기반하여 비디오 품질을 예측한다. 이러한 모델을 활용해 원본 비디오 없이도 인간의 주관적 품질 판단과 높은 상관성을 갖는 품질 점수를 예측할 수 있는 비디오 품질 평가(VQA) 알고리즘을 위한 통계적 특징과 인지적 특징을 정의한다. 본 논문의 기여는 세 가지이다. 1) 비디오를 위한 공간-시간 자연 장면 통계(NSS) 모델을 제안한다. 2) 비디오 장면 내 움직임의 일관성(motion coherency)을 정량화하는 움직임 모델을 제안한다. 3) 제안된 NSS 모델과 움직임 일관성 모델이 비디오 품질 평가에 적합함을 입증하고, 이를 바탕으로 인간의 품질 판단과 높은 상관성을 가지는 블라인드(VQA) 알고리즘을 설계한다. 제안된 알고리즘인 video BLIINDS는 LIVE VQA 데이터베이스와 EPFL-PoliMi 비디오 데이터베이스에서 검증되었으며, 최고 수준의 감소된 참조 및 완전한 참조 VQA 알고리즘과 비슷한 성능을 보였다.