HyperAIHyperAI

Command Palette

Search for a command to run...

人物再識別のための汎用的オムニスケール表現の学習

Kaiyang Zhou Yongxin Yang Andrea Cavallaro Tao Xiang

概要

効果的な人物再識別(re-ID)モデルは、外見が似た人物を区別できるようにするための判別性(discriminative)な特徴表現を学習するとともに、適応なしに複数のデータセットに展開可能な汎化性(generalisable)な特徴を学習する必要がある。本論文では、これらの課題に対処するための新たなCNNアーキテクチャを開発する。まず、異なる空間スケールを捉えるだけでなく、複数スケールの相乗的な組み合わせを表現する「オムニスケール特徴(omni-scale features)」を学習可能な、新たなre-ID用CNNであるオムニスケールネットワーク(OSNet)を提案する。OSNetの基本構成要素は、それぞれ異なるスケールでの特徴を検出する複数の畳み込みストリームから構成される。オムニスケール特徴の学習のため、チャネルごとの重みを用いて多スケール特徴を動的に統合する統一型アグリゲーションゲートを導入している。OSNetは、因子分解畳み込み(factorised convolutions)を用いることで軽量な構造を実現している。次に、汎化性の向上を図るため、OSNetにインスタンス正規化(instance normalisation, IN)層を導入し、異なるデータセット間の差異に対応する。さらに、IN層のアーキテクチャ内での最適配置を決定するために、効率的な微分可能なアーキテクチャ探索アルゴリズムを提案している。広範な実験の結果、従来の同一データセット設定においても、既存のre-IDモデルと比べてはるかに小型であるにもかかわらず、最先端の性能を達成している。また、より挑戦的でありながら実用的な異データセット設定(cross-dataset setting)においても、ターゲットデータを一切使用せずに、最近の非教師ありドメイン適応(unsupervised domain adaptation)手法の多くを上回る結果を得た。本研究のコードおよびモデルは、\texttt{https://github.com/KaiyangZhou/deep-person-reid}にて公開されている


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています