オブジェクト追跡は、動画シーケンス中に出現する特定のオブジェクトを、その特徴や変化を観察しながら追跡する技術である。近年、シアメーズネットワーク(Siamese network)をオブジェクト追跡分野に応用することで、高い性能を示す多数のアルゴリズムが登場している。シアメーズネットワークは、二つの画像間の類似性を学習するように設計されたネットワークであり、オブジェクト追跡では、検索画像内においてターゲット画像と最も類似する位置を探索することでオブジェクトを追跡する。しかし、シアメーズネットワークに基づく追跡アルゴリズムは、オブジェクトの部分的・完全的遮蔽に対して脆弱である。さらに、初期フレームにおける真値バウンディングボックス(ground-truth bounding box)から得られた画像との類似性のみを用いて追跡を行うため、一度オブジェクトを逃すと誤差が累積し、追跡対象からオブジェクトが逸脱する現象が頻発するという問題がある。本研究では、オブジェクトの部分的・完全的遮蔽後に追跡成功の報酬を最大化できる強化学習モデルを提案する。また、最近のフレームで成功裏に追跡されたテンプレートを動的に交換する手法を導入し、オブジェクトのドリフト問題を解決することを目的とする。提案モデルを代表的なオブジェクト追跡ベンチマークであるVOT2018およびOTB50において、既存の追跡モデルに適用して定量的性能を評価した結果、精度が向上し、追跡失敗の回数が従来手法よりも減少することが確認された。その結果、VOT2018では精度(Accuracy)0.618、ロバスト性(Robustness)0.234、期待平均オーバーラップ(EAO)0.416を達成し、OTB50では成功度(Success)0.673、精度(Precision)0.881を達成した。