14日前
動画人物再識別における競争的スニペット類似度集約とコアテンションスニペット埋め込み
{Tong Xiao, Dapeng Chen, Hongsheng Li, Xiaogang Wang, Shuai Yi}

要約
本稿では、競争的スニペット類似度集約と共同注意スニペット埋め込みを用いた、動画ベースの人物再識別に取り組む。提案手法は、長時間の人物シーケンスを複数の短い動画スニペットに分割し、上位ランクのスニペット類似度を統合することで、シーケンス間類似度を推定する。この戦略により、各サンプルの人物内視覚変動を最小限に抑えながら、多様な外見情報および時間的情報を維持することが可能となる。スニペット類似度は、新たな時系列共同注意機構を備えた深層ニューラルネットワークにより推定される。この注意重みは、LSTMネットワークにより全プローブスニペットから学習されたクエリ特徴に基づいて算出されるため、ノイズの多いフレームの影響を受けにくく、より安定した埋め込みが得られる。ギャラリー側のスニペットはプローブスニペットと同一のクエリ特徴を共有するため、プローブスニペットと比較する際により関連性の高い特徴を抽出でき、より正確なスニペット類似度の推定が可能となる。広範なアブレーション研究により、競争的スニペット類似度集約および時系列共同注意埋め込みの有効性が実証された。本手法は、複数のデータセットにおいて、現在の最先端手法を顕著に上回る性能を達成した。