15 天前
基于VMAF与熵差的高帧率视频质量评估
Pavan C Madhusudana, Neil Birkbeck, Yilin Wang, Balu Adsumilli, Alan C. Bovik

摘要
随着具有实时性与高动态内容的流媒体视频日益流行,高帧率(High Frame Rate, HFR)视频的研究受到越来越多关注。本文针对在视频比较过程中帧率与压缩因子不同的情况下,帧率相关视频质量评估(Frame Rate Dependent Video Quality Assessment, VQA)所面临的问题展开研究。当前主流的VQA模型(如VMAF)在待比较视频具有相同帧率且包含传统失真(如压缩、缩放等)时,表现出与主观感知判断高度一致的性能。然而,当涉及不同帧率的视频比较时,该框架需要额外的预处理步骤,可能影响其整体评估效果。近期提出的广义熵差(Generalized Entropic Difference, GREED)VQA模型,旨在建模因帧率变化引发的视觉伪影(如抖动、闪烁等),并在包含此类帧率相关失真的LIVE-YT-HFR数据集上展现出优异性能。本文提出一种简单而有效的扩展方法,将VMAF与GREED模型的特征进行融合,以兼顾两者的优势。通过一系列实验验证,所提出的融合框架能够生成更高效、更具判别力的特征,用于预测帧率相关的视频质量。此外,我们在标准的非HFR VQA数据集上对融合特征集进行了评估,结果表明其性能优于GREED与VMAF各自单独使用的情况,说明融合特征集能够捕捉到互补的感知质量信息,具有更强的泛化能力。