17 天前

PADS:面向视觉相似性学习的策略自适应采样

Karsten Roth, Timo Milbich, Björn Ommer
PADS:面向视觉相似性学习的策略自适应采样
摘要

学习视觉相似性通常需要建模图像三元组之间的关系。尽管三元组方法具有强大的表达能力,但其计算复杂度较高,通常只能在所有可能的训练三元组中选取子集进行训练。因此,在学习过程中决定何时使用哪些训练样本的采样策略至关重要。目前主流的采样方法为固定采样或课程学习(curriculum)采样策略,这些策略在训练开始前即被预先设定。然而,该问题本质上更需要一种能够根据训练过程中相似性表示的实际状态动态调整的采样机制。为此,我们引入强化学习,设计一个教师网络,根据学习网络(即视觉相似性表示)的当前状态动态调整采样分布。在标准三元组损失函数基础上,基于基准数据集的实验表明,我们的自适应采样策略显著优于固定采样策略。此外,尽管我们的方法仅在基础三元组学习框架之上应用自适应采样,仍能取得与当前最先进方法相媲美的性能,而后者通常依赖于多样化的额外学习信号或复杂的集成架构。相关代码可于 https://github.com/Confusezius/CVPR2020_PADS 获取。

PADS:面向视觉相似性学习的策略自适应采样 | 最新论文 | HyperAI超神经