6 个月前

计算机视觉

Peng Chu Jiang Wang Quanzeng You Haibin Ling Zicheng Liu

摘要

在视频中实现多目标跟踪依赖于对目标之间时空交互关系的有效建模。本文提出了一种名为TransMOT的解决方案，该方法利用强大的图Transformer架构，高效地建模目标间的空间与时间交互关系。TransMOT通过将跟踪目标的轨迹表示为一组稀疏加权图，构建了空间图Transformer编码器层、时间Transformer编码器层以及空间图Transformer解码器层，从而有效建模大量目标之间的交互。与传统Transformer相比，TransMOT不仅具有更高的计算效率，还实现了更优的跟踪精度。为进一步提升跟踪速度与准确性，本文还提出了一种级联关联框架，用于处理低置信度检测结果以及需要大量计算资源建模的长期遮挡问题。所提出的方法在MOT15、MOT16、MOT17和MOT20等多个基准数据集上进行了评估，均取得了当前最优的性能表现。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

Peng Chu Jiang Wang Quanzeng You Haibin Ling Zicheng Liu

摘要

在视频中实现多目标跟踪依赖于对目标之间时空交互关系的有效建模。本文提出了一种名为TransMOT的解决方案，该方法利用强大的图Transformer架构，高效地建模目标间的空间与时间交互关系。TransMOT通过将跟踪目标的轨迹表示为一组稀疏加权图，构建了空间图Transformer编码器层、时间Transformer编码器层以及空间图Transformer解码器层，从而有效建模大量目标之间的交互。与传统Transformer相比，TransMOT不仅具有更高的计算效率，还实现了更优的跟踪精度。为进一步提升跟踪速度与准确性，本文还提出了一种级联关联框架，用于处理低置信度检测结果以及需要大量计算资源建模的长期遮挡问题。所提出的方法在MOT15、MOT16、MOT17和MOT20等多个基准数据集上进行了评估，均取得了当前最优的性能表现。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供