7日前

TransReID:Transformerを基盤としたオブジェクト再識別

Shuting He, Hao Luo, Pichao Wang, Fan Wang, Hao Li, Wei Jiang
TransReID:Transformerを基盤としたオブジェクト再識別
要約

オブジェクト再識別(ReID)におけるロバストな特徴表現の抽出は、重要な課題の一つである。従来、畳み込みニューラルネットワーク(CNN)を基盤とする手法は優れた成果を上げてきたが、一つの局所領域しか同時に処理できず、畳み込み演算およびダウンサンプリング演算(例えばプーリングやストライド付き畳み込み)によって細部情報が損失するという問題を抱えている。これらの制約を克服するため、本研究では完全にTransformerベースのオブジェクトReIDフレームワーク「TransReID」を提案する。具体的には、画像をパッチの系列として符号化し、いくつかの重要な改良を加えたTransformerベースの強力なベースラインを構築した。このベースラインは、CNNベースの手法と比較しても競争力のある結果を複数のReIDベンチマークで達成している。さらに、Transformerにおける特徴学習のロバスト性を向上させるために、2つの新しいモジュールを考案した。(i) ジグソーパッチモジュール(JPM)は、シフト操作とパッチシャッフル操作を用いてパッチ埋め込みを再配置することで、識別能が向上し、より多様なカバー範囲を持つロバストな特徴を生成する。(ii) サイド情報埋め込み(SIE)は、学習可能な埋め込みを導入することで、カメラや視点の変化に起因する特徴バイアスを軽減する。本研究は、ReID研究において完全なTransformerを採用した初めての取り組みであると認識している。実験結果によると、TransReIDは人間および車両ReIDベンチマークの両方で最先端の性能を達成しており、優れた有効性を示している。