
摘要
尺度不变性(scale-invariance)是计算机视觉多个子领域中尚未解决的开放性问题。例如,物体标签在不同尺度下应保持一致,但模型预测在许多情况下却出现显著偏差。当真实标签随呈现尺度发生变化时,这一问题变得更加复杂。在图像质量评估(Image Quality Assessment, IQA)任务中,图像下采样会削弱失真效应(如模糊或压缩伪影),这可能在主观评价中产生积极影响。因此,为了准确预测感知图像质量,跨分辨率IQA方法必须同时考虑由模型能力不足引起的尺度相关误差,以及真实标签中因分辨率变化而产生的感知标签偏移。本文首次通过KonX——一个精心构建的新型跨分辨率IQA数据库,对上述两类问题进行解耦并分别开展系统研究。本文的主要贡献包括:1. 基于KonX,我们提供了实证证据,证明呈现分辨率的变化会导致标签发生系统性偏移;2. 我们揭示了现有客观IQA方法存在显著的尺度偏差(scale bias),该偏差会降低其预测性能;3. 我们提出一种多尺度、多列结构的深度神经网络(DNN)架构,在该任务上显著优于以往的最先进IQA模型,包括近期基于Transformer的模型。综上所述,本研究不仅提出了一项图像质量评估领域的新研究问题,也提供了有效的解决方案,推动了该方向的深入发展。