
要約
個体レベルの認識問題として、人物再識別(Person Re-Identification, ReID)は、異なる空間スケールだけでなく、複数のスケールの任意の組み合わせをもカプセル化する差別的な特徴に依存しています。これらの均質および非均質なスケールの特徴をオムニスケール特徴と呼びます。本論文では、オムニスケール特徴学習のために新しい深層ReID CNNが設計され、Omni-Scale Network (OSNet) と命名されました。これは、特定のスケールで特徴を検出する複数の畳み込みストリームから構成される残差ブロックを設計することで達成されます。重要な点は、入力に依存したチャネルごとの重みで多スケール特徴を動的に融合するための新しい統合アグリゲーションゲートが導入されていることです。効率的に空間チャネル相関を学習し、過学習を避けるために、ビルディングブロックはポイントワイズ畳み込みとディープワイズ畳み込みを使用します。このようなブロックを層ごとに積み重ねることにより、我々のOSNetは非常に軽量であり、既存のReIDベンチマークに対してゼロから訓練することができます。モデルサイズが小さいにもかかわらず、OSNetは6つの人物ReIDデータセットで最先端の性能を達成し、多くの大規模モデルよりも優れた結果を示しています。コードとモデルは以下のURLから入手可能です: \url{https://github.com/KaiyangZhou/deep-person-reid}。