8 个月前

摘要

为满足对大尺寸图像（2K–8K）超分辨率（SR）日益增长的需求，当前主流方法主要沿着两条独立路径发展：其一，通过内容感知路由加速现有网络；其二，借助令牌混合器（token mixer）优化设计更优的超分辨率网络。然而，这两种方法虽具直接性，却不可避免地存在固有缺陷（如路径选择僵化或处理缺乏区分性），严重制约了质量与复杂度之间权衡关系的进一步优化。为克服上述局限，本文提出一种内容感知混合器（Content-aware Mixer, CAMixer），将上述两种策略有机融合。CAMixer根据输入内容的复杂程度动态分配计算资源：对于简单场景采用常规卷积处理，而对于稀疏纹理区域则引入可变形窗口注意力机制，以增强细节建模能力。具体而言，CAMixer设计了一个可学习的预测器，用于生成多个引导信号，包括用于窗口形变的偏移量、用于窗口分类的掩码，以及赋予卷积操作动态特性的卷积注意力权重。该机制能够自适应地调节注意力分布，主动聚焦于更具信息量的纹理区域，显著提升卷积模块的表征能力。此外，本文进一步引入全局分类损失（global classification loss），以提升预测器的准确性与鲁棒性。通过简单堆叠多个CAMixer模块，我们构建了CAMixerSR模型，在大尺寸图像超分辨率、轻量化超分辨率以及全景图像超分辨率任务中均取得了卓越性能，显著超越现有方法。

源 PDF