8 个月前

计算机视觉

计算机视觉

Deuser Fabian ; Habel Konrad ; Werner Martin ; Oswald Norbert

摘要

检索相关多媒体内容是数据驱动世界中面临的主要问题之一。随着无人机的普及，高质量的航拍画面首次向广大观众开放。将这些画面整合到应用中可以实现无需GPS的地理定位或位置校正。在本文中，我们提出了一种基于方向引导的训练框架，用于无人机视角下的地理定位。通过层次化的定位方法，估计无人机图像相对于卫星影像的方向。我们设计了一个轻量级预测模块，该模块基于对比学习嵌入（contrastive learned embeddings）预测不同视图之间的方向。实验结果表明，这种预测支持了训练过程，并且优于以往的方法。提取出的伪标签还使得卫星图像能够在增强过程中进行对齐旋转，从而进一步提高泛化能力。在推理阶段，我们不再需要这个方向模块，这意味着不需要额外的计算资源。我们在University-1652和University-160k数据集上均取得了最先进的结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

8 个月前

计算机视觉

计算机视觉

Deuser Fabian ; Habel Konrad ; Werner Martin ; Oswald Norbert

摘要

检索相关多媒体内容是数据驱动世界中面临的主要问题之一。随着无人机的普及，高质量的航拍画面首次向广大观众开放。将这些画面整合到应用中可以实现无需GPS的地理定位或位置校正。在本文中，我们提出了一种基于方向引导的训练框架，用于无人机视角下的地理定位。通过层次化的定位方法，估计无人机图像相对于卫星影像的方向。我们设计了一个轻量级预测模块，该模块基于对比学习嵌入（contrastive learned embeddings）预测不同视图之间的方向。实验结果表明，这种预测支持了训练过程，并且优于以往的方法。提取出的伪标签还使得卫星图像能够在增强过程中进行对齐旋转，从而进一步提高泛化能力。在推理阶段，我们不再需要这个方向模块，这意味着不需要额外的计算资源。我们在University-1652和University-160k数据集上均取得了最先进的结果。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供