2ヶ月前

文化的認識を考慮した控えめな服装での人物再識別のベンチマーク

Moghaddam, Alireza Sedighi ; Anvari, Fatemeh ; Haghighi, Mohammadjavad Mirshekari ; Fakhari, Mohammadali ; Mohammadi, Mohammad Reza
文化的認識を考慮した控えめな服装での人物再識別のベンチマーク
要約

人物再識別(Person Re-Identification, ReID)は、監視やセキュリティなどの重要な応用を持つコンピュータビジョンの基本的な課題です。近年の進歩にもかかわらず、既存のReIDモデルは多様な文化的背景、特にイランのようなイスラム地域における控えめな服装スタイルが一般的な環境での汎化にしばしば苦労しています。既存のデータセットは主に西洋と東アジアのファッションを特徴としており、これらの設定での適用性が制限されています。このギャップを埋めるために、我々はイラン科学技術大学人物再識別データセット(Iran University of Science and Technology Person Re-Identification, IUST_PersonReId)を導入します。このデータセットは、新しい文化的環境におけるReIDの固有の課題を反映し、特に控えめな服装とイランの市場、キャンパス、モスクなど多様なシナリオを強調して設計されています。IUST_PersonReId上で最先端のモデルである意味制御自己教師学習(Semantic Controllable Self-supervised Learning, SOLIDER)や対照的言語画像事前学習再識別(Contrastive Language-Image Pretraining Re-Identification, CLIP-ReID)を使用した実験では、Market1501やMulti-Scene MultiTime (MSMT17) などのベンチマークと比較して著しい性能低下が観察されました。具体的には、SOLIDERはMarket1501とMSMT17に対してそれぞれ50.75%と23.01%の平均精度平均値(Mean Average Precision, mAP)が低下しており、CLIP-ReIDも同様に38.09%と21.74%のmAP低下が見られました。これは遮蔽物や限定的な特徴点による課題を示しています。時系列評価では、時間的文脈を利用することで改善が見られました。これにより、IUST_PersonReIdが文化的配慮と堅牢性のあるReIDシステムの開発に向けた潜在能力を持っていることが強調されます。IUST_PersonReIdは、世界中のReID研究における公平性と偏りへの対処において重要な資源を提供します。