12日前

画像ベースかつ部分的カテゴリカルなアノテーションアプローチによる歩行者属性認識

{Ahmad Kalhor, Mehdi Tale Masouleh, Seraj Ghasemi, Shayan Samiee, Farbod Siahkali, Hossein Bodaghi}
要約

テキスト検索機能は、歩行者属性認識(PAR)を用いることで、人物再識別(re-ID)監視システムに追加可能である。再IDモデルにCNNベースのPARモジュールを組み込むことは、両タスクにおいて効率的であるが、現状ではモデルの改変に注力するのではなく、データの改良に焦点を当てたアプローチはあまり見られない。計算コストや導入の難易度、一般化性能を考慮せずに、多数の最新のマルチタスク手法は、固定データセット上で新たなモデルやアーキテクチャを用いて従来手法を上回ることに注力している。本研究では、データがPARの結果に与える影響を検証するため、DukeMTMC-reIDデータセットの36,411枚の画像を用いて、74種類の歩行者属性を対象とした画像ベースの部分的カテゴリ属性データセット(CA-Duke)を提案する。しかし、今日の手法では、新たなモジュールをベースラインに追加する位置を決定するための体系的なアプローチが確立されておらず、多タスクネットワークを構築する際には実験的なプロセスによって位置を決定しているのが現状である。本研究では、再ID事前学習済みネットワークにPARモジュールを追加する最適な位置を特定するため、潜在空間におけるデータの分離性を評価する新しい指標「分離指数(Separation Index, SI)」を導入し、二段階学習法を提案する。最終的に、属性認識および検索結果に関する広範な実験から、包括的かつ画像ベースのアノテーションがF1スコアにおいてネットワークの性能を3.31%向上させることを示した。さらに、SIと事前学習済みネットワークを組み合わせることで、PARタスクにおいて最先端の性能が達成可能であることが明らかになった。

画像ベースかつ部分的カテゴリカルなアノテーションアプローチによる歩行者属性認識 | 最新論文 | HyperAI超神経