11日前

RPT:シamese視覚追跡のためのポイント集合表現学習

Ziang Ma, Linyuan Wang, Haitao Zhang, Wei Lu, Jun Yin
RPT:シamese視覚追跡のためのポイント集合表現学習
要約

堅牢な視覚追跡において顕著な進展が達成されてきたが、正確なターゲット状態推定は依然として極めて困難な課題である。本論文では、この問題が広く用いられているバウンディングボックス表現に起因していると主張する。バウンディングボックスは物体の空間的範囲を粗い形でしか表現できず、その制約が精度の向上を妨げていると考えられる。そこで、ターゲットの空間的状態をより細かい表現として代表点の集合で表すことで、高精度な状態推定を実現する効率的な視覚追跡フレームワークを提案する。この点集合は、ターゲット領域における意味的・幾何学的に重要な位置を学習することで、物体の外観をより細分化された形で局所化・モデリング可能にする。さらに、階層的な畳み込み層を統合するマルチレベル集約戦略を導入し、物体の詳細な構造情報を効果的に抽出する。OTB2015、VOT2018、VOT2019、GOT-10kなど複数の困難なベンチマークにおいて実施された広範な実験により、本手法が20 FPS以上の実行速度を維持しつつ、最新の最先端性能を達成することが示された。

RPT:シamese視覚追跡のためのポイント集合表現学習 | 最新論文 | HyperAI超神経