HyperAIHyperAI

Command Palette

Search for a command to run...

ビジュアル追跡のシーケンスレベルでの学習に向けて

Minji Kim Seungkwan Lee Jungseul Ok Bohyung Han Minsu Cho

概要

機械学習が視覚的な物体追跡タスクに広く採用されているにもかかわらず、最近の学習ベースのアプローチは、視覚追跡が本質的にシーケンスレベルのタスクであるという事実を大きく見落としています。それらはフレームレベルでの訓練に大きく依存しており、データ分布やタスク目標において訓練とテストの間に一貫性がないという問題を避けられません。本研究では、強化学習に基づいた視覚追跡のシーケンスレベルでの訓練戦略を導入し、データサンプリング、学習目標、データ拡張のシーケンスレベル設計が追跡アルゴリズムの精度と堅牢性をどのように向上させるかについて議論します。LaSOT, TrackingNet, GOT-10kなどの標準ベンチマークにおける実験結果から、代表的な4つの追跡モデル(SiamRPN++, SiamAttn, TransT, TrDiMP)が提案手法を取り入れることで訓練中に一貫して性能が向上することを示しています。これらのモデルはアーキテクチャを変更せずに性能向上を達成しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています