
摘要
FovVideoVDP 是一种视频差异度量方法,能够同时建模视觉感知的空间、时间以及周边视觉特性。尽管目前已存在多种视频质量评估指标,但本研究首次在实际应用中系统地整合了视觉感知的这三个核心方面。在视网膜不同位置上,空间与时间敏感性之间的复杂相互作用,对于覆盖大视场角的显示设备(如虚拟现实与增强现实显示系统)尤为重要,也与诸如视区聚焦渲染(foveated rendering)等关键技术密切相关。本度量方法基于对早期视觉系统的心理物理学研究,综合考虑了时空对比敏感度、皮层放大效应(cortical magnification)以及对比掩蔽(contrast masking)等机制。该模型还充分考虑了显示设备的物理参数(如亮度、尺寸、分辨率)以及观看距离等因素。为验证该度量方法的有效性,我们构建了一个全新的视区聚焦渲染数据集,用于捕捉由采样与重建过程引起的画质退化现象。为进一步展示算法的通用性,我们在三个独立的视区聚焦视频数据集以及一个大规模图像质量数据集上进行了测试,结果表明,相较于当前最先进的方法,FovVideoVDP 在所有数据集上均取得了最佳性能。