
摘要
地标定位是计算机视觉中的一个具有挑战性的问题,拥有广泛的应用。近年来,基于深度学习的方法通过回归概率图而不是直接回归坐标,展示了改进的结果。然而,在训练过程中设置这些回归目标的精度是一个繁琐的过程,因为它在可训练性和定位准确性之间产生了权衡。使用精确的目标会引入显著的采样偏差,从而使得训练更加困难;而使用不精确的目标则会导致地标检测器的准确性降低。在本文中,我们引入了“Adaloss”,这是一种自适应目标函数,在训练过程中根据训练统计信息更新目标精度。该方法不需要设置特定问题的参数,并且在训练中表现出更高的稳定性以及在推理时具有更好的定位准确性。我们在三个不同的地标定位应用中展示了所提出方法的有效性:1)在医学X射线图像中精确检测导管尖端这一具有挑战性的任务;2)在内窥镜图像中定位手术器械;3)在野外图像上定位面部特征,在300-W基准数据集上展示了最先进的结果。