15日前

動画に基づく人物再識別を 위한マルチグラニュラリティ・ハイパーグラフの学習

Yichao Yan, Jie Qin1, Jiaxin Chen, Li Liu, Fan Zhu, Ying Tai, Ling Shao
動画に基づく人物再識別を 위한マルチグラニュラリティ・ハイパーグラフの学習
要約

動画ベースの人物再識別(re-ID)は、コンピュータビジョン分野における重要な研究課題である。この困難なタスクに取り組む鍵は、動画シーケンスにおける空間的および時間的特徴を有効に活用することにある。本研究では、複数の粒度(granularity)に基づいて空間時間的依存関係をモデル化することで、より優れた表現能力を実現するための新しいグラフベースの枠組み、すなわち「マルチグランラールハイパーグラフ(Multi-Granular Hypergraph, MGH)」を提案する。具体的には、動画シーケンス全体にわたる部分ベースの特徴を複数のレベルで用いて、異なる空間粒度を持つハイパーグラフを構築する。各ハイパーグラフにおいては、時間的に異なる範囲に跨るグラフノード(すなわち部分ベースの特徴)を接続するハイパーエッジによって、異なる時間粒度を捉える。さらに、提案するハイパーグラフ伝搬および特徴集約スキームにより、重要な課題である「誤同期(misalignment)」および「遮蔽(occlusion)」を明示的に扱う。最後に、相互情報量の最小化に基づいて、複数の粒度にわたるより多様なグラフレベル表現を学習することで、全体的な動画表現をさらに強化する。広範な実験により、3つの広く用いられているベンチマーク上で本フレームワークの有効性が明確に示された。特に、MARSデータセットにおいて90.0%のトップ1精度を達成し、既存の最先端手法を上回った。コードは以下のURLから公開されている:https://github.com/daodaofr/hypergraph_reid。

動画に基づく人物再識別を 위한マルチグラニュラリティ・ハイパーグラフの学習 | 最新論文 | HyperAI超神経