
要約
近年、深層学習モデルの動画人物再識別(Re-ID)への応用において顕著な進展が見られている。動画人物Re-IDの鍵となる要素の一つは、多様で複雑な状況下でも効果的に識別力と頑健性に優れた動画特徴表現を構築することである。部分ベースのアプローチは、空間的・時系列的な注目機構を用いて代表的な局所特徴を抽出するが、従来の手法では異なる部分間の相関関係が無視されていた。本研究では、異なる部分間の関係性を活用するため、動画人物Re-IDに向けた革新的な適応型グラフ表現学習スキームを提案する。この手法により、関連する領域特徴間の文脈的相互作用を実現できる。具体的には、ポーズアライメント接続と特徴類似度接続を活用して、構造に敏感な適応型隣接グラフを構築し、グラフノード間の内在的関係をモデル化する。その後、この隣接グラフ上で特徴伝播を実行し、局所特徴を反復的に精緻化する。この過程では、隣接ノードの情報も部分特徴表現に組み込まれる。さらに、コンパクトかつ識別力の高い表現を学習するために、新たな時系列解像度に依存する正則化項を提案する。この正則化項は、同一人物の異なる時系列解像度間での一貫性を強制することで、より堅牢な特徴表現を促進する。本手法は、iLIDS-VID、PRID2011、MARS、DukeMTMC-VideoReIDの4つのベンチマーク上で広範な評価を実施し、競争力ある性能を達成した。これらの結果は、提案手法の有効性を実証している。実装コードは、https://github.com/weleen/AGRL.pytorch にて公開されている。