6 个月前

摘要

随着具有实时性与高动态内容的流媒体视频日益流行，高帧率（High Frame Rate, HFR）视频的研究受到越来越多关注。本文针对在视频比较过程中帧率与压缩因子不同的情况下，帧率相关视频质量评估（Frame Rate Dependent Video Quality Assessment, VQA）所面临的问题展开研究。当前主流的VQA模型（如VMAF）在待比较视频具有相同帧率且包含传统失真（如压缩、缩放等）时，表现出与主观感知判断高度一致的性能。然而，当涉及不同帧率的视频比较时，该框架需要额外的预处理步骤，可能影响其整体评估效果。近期提出的广义熵差（Generalized Entropic Difference, GREED）VQA模型，旨在建模因帧率变化引发的视觉伪影（如抖动、闪烁等），并在包含此类帧率相关失真的LIVE-YT-HFR数据集上展现出优异性能。本文提出一种简单而有效的扩展方法，将VMAF与GREED模型的特征进行融合，以兼顾两者的优势。通过一系列实验验证，所提出的融合框架能够生成更高效、更具判别力的特征，用于预测帧率相关的视频质量。此外，我们在标准的非HFR VQA数据集上对融合特征集进行了评估，结果表明其性能优于GREED与VMAF各自单独使用的情况，说明融合特征集能够捕捉到互补的感知质量信息，具有更强的泛化能力。

源 PDF