HyperAI超神经

Visual Prompt Tuning

Visual Prompt Tuning (VPT) 是一种参数高效的微调方法,通过在输入空间中引入少量任务特定的可学习参数,同时冻结预训练的Transformer主干网络,在下游任务训练过程中与线性头共同优化。VPT 在低数据量场景下表现出色,并且在不同数据规模下保持优势。此外,VPT 对多种Transformer 规模和设计(如 ViTBase/Large/Huge, Swin)具有竞争力,是适应不断增长的视觉主干网络的有效途径。