7日前

複数視点知識蒸留を用いたロバストな再識別

Angelo Porrello, Luca Bergamini, Simone Calderara
複数視点知識蒸留を用いたロバストな再識別
要約

再識別(Re-Identification)におけるロバスト性を実現するため、従来の手法は動画間(Video-To-Video)のアプローチで追跡情報を活用する。しかし、こうした手法は単一画像クエリ(例:Image-To-Video設定)に対して性能が著しく低下するという課題に直面している。近年の研究では、動画ベースのネットワークから画像ベースのネットワークへ時間的情報を転移することで、この深刻な性能低下を緩和しようとしている。本研究では、対象物体を複数の視点から捉えた画像群から得られる優れた知識を転移可能とする訓練戦略を提案する。本手法は「視点知識蒸留(Views Knowledge Distillation, VKD)」と命名され、教師-生徒フレームワーク内において、複数の視点を観察する教師モデルが、視点が限られた生徒モデルを指導する。ここで、教師モデルが持つ視点の多様性を監督信号として用いることで、生徒モデルは教師自身をも上回る性能を発揮する。その結果、Image-To-Video設定において、現在の最先端手法を大幅に上回ることを確認した(MARSで6.3%のmAP向上、Duke-Video-ReIDで8.6%、VeRi-776で5%)。さらに、人物・車両・動物の再識別を対象とした包括的な分析を通じて、VKDの特性を定性的・定量的に検証した。コードはGitHubにて公開されている:https://github.com/aimagelab/VKD。

複数視点知識蒸留を用いたロバストな再識別 | 最新論文 | HyperAI超神経