Command Palette
Search for a command to run...
SiamVGG: 深層シアミーズネットワークを用いた視覚追跡
SiamVGG: 深層シアミーズネットワークを用いた視覚追跡
Yuhong Li; Xiaofan Zhang; Deming Chen
概要
最近、深層ニューラルネットワーク(DNN)を基盤とする視覚追跡ソリューションの急速な発展が見られています。一部の追跡器は、DNNベースのソリューションと判別相関フィルター(DCF)を組み合わせて、意味的な特徴を抽出し、最先端の追跡精度を達成しています。しかし、これらのソリューションは非常に計算量が多く、処理時間が長くなるため、リアルタイム性能が確保されないという問題があります。高精度と信頼性のあるリアルタイム性能の両方を実現するため、私たちは新しい追跡器であるSiamVGG\footnote{https://github.com/leeyeehoo/SiamVGG}を提案します。この追跡器は、畳み込みニューラルネットワーク(CNN)のバックボーンとクロスコ relational operator を組み合わせており、代表画像から得られる特徴を利用することでより正確な物体追跡を行います。SiamVGGのアーキテクチャはVGG-16からカスタマイズされており、代表画像と入力ビデオフレーム双方でパラメータが共有されています。私たちはOTB-2013/50/100およびVOT 2015/2016/2017データセット上で提案されたSiamVGGの性能を示し、最先端の精度を維持しながらGTX 1080Ti上で50 FPSの適切なリアルタイム性能を達成しています。私たちの設計はVOT2017チャレンジにおいてECOやC-COTよりも2%高い予想平均重複率(Expected Average Overlap: EAO)を達成できます。