7 个月前

计算机视觉

卷积神经网络

计算机视觉

Brian Teixeira; Birgi Tamersoy; Vivek Singh; Ankur Kapoor

摘要

地标定位是计算机视觉中的一个具有挑战性的问题，拥有广泛的应用。近年来，基于深度学习的方法通过回归概率图而不是直接回归坐标，展示了改进的结果。然而，在训练过程中设置这些回归目标的精度是一个繁琐的过程，因为它在可训练性和定位准确性之间产生了权衡。使用精确的目标会引入显著的采样偏差，从而使得训练更加困难；而使用不精确的目标则会导致地标检测器的准确性降低。在本文中，我们引入了“Adaloss”，这是一种自适应目标函数，在训练过程中根据训练统计信息更新目标精度。该方法不需要设置特定问题的参数，并且在训练中表现出更高的稳定性以及在推理时具有更好的定位准确性。我们在三个不同的地标定位应用中展示了所提出方法的有效性：1）在医学X射线图像中精确检测导管尖端这一具有挑战性的任务；2）在内窥镜图像中定位手术器械；3）在野外图像上定位面部特征，在300-W基准数据集上展示了最先进的结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

计算机视觉

卷积神经网络

计算机视觉

Brian Teixeira; Birgi Tamersoy; Vivek Singh; Ankur Kapoor

摘要

地标定位是计算机视觉中的一个具有挑战性的问题，拥有广泛的应用。近年来，基于深度学习的方法通过回归概率图而不是直接回归坐标，展示了改进的结果。然而，在训练过程中设置这些回归目标的精度是一个繁琐的过程，因为它在可训练性和定位准确性之间产生了权衡。使用精确的目标会引入显著的采样偏差，从而使得训练更加困难；而使用不精确的目标则会导致地标检测器的准确性降低。在本文中，我们引入了“Adaloss”，这是一种自适应目标函数，在训练过程中根据训练统计信息更新目标精度。该方法不需要设置特定问题的参数，并且在训练中表现出更高的稳定性以及在推理时具有更好的定位准确性。我们在三个不同的地标定位应用中展示了所提出方法的有效性：1）在医学X射线图像中精确检测导管尖端这一具有挑战性的任务；2）在内窥镜图像中定位手术器械；3）在野外图像上定位面部特征，在300-W基准数据集上展示了最先进的结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供