2ヶ月前

ビジュアル追跡のシーケンスレベルでの学習に向けて

Minji Kim; Seungkwan Lee; Jungseul Ok; Bohyung Han; Minsu Cho
ビジュアル追跡のシーケンスレベルでの学習に向けて
要約

機械学習が視覚的な物体追跡タスクに広く採用されているにもかかわらず、最近の学習ベースのアプローチは、視覚追跡が本質的にシーケンスレベルのタスクであるという事実を大きく見落としています。それらはフレームレベルでの訓練に大きく依存しており、データ分布やタスク目標において訓練とテストの間に一貫性がないという問題を避けられません。本研究では、強化学習に基づいた視覚追跡のシーケンスレベルでの訓練戦略を導入し、データサンプリング、学習目標、データ拡張のシーケンスレベル設計が追跡アルゴリズムの精度と堅牢性をどのように向上させるかについて議論します。LaSOT, TrackingNet, GOT-10kなどの標準ベンチマークにおける実験結果から、代表的な4つの追跡モデル(SiamRPN++, SiamAttn, TransT, TrDiMP)が提案手法を取り入れることで訓練中に一貫して性能が向上することを示しています。これらのモデルはアーキテクチャを変更せずに性能向上を達成しています。

ビジュアル追跡のシーケンスレベルでの学習に向けて | 最新論文 | HyperAI超神経