Réflexion sur la reconnaissance des attributs piétons : Jeux de données réalistes avec méthode efficace

Bien que diverses méthodes aient été proposées pour faire des progrès dans la reconnaissance des attributs piétons, un problème crucial dans les jeux de données existants est souvent négligé : la présence d'un grand nombre d'identités piétons identiques dans les ensembles d'entraînement et de test, ce qui n'est pas conforme aux applications pratiques. Par conséquent, les images des mêmes identités piétons dans l'ensemble d'entraînement et celui de test sont extrêmement similaires, conduisant à une surestimation des performances des méthodes de pointe sur les jeux de données existants. Pour résoudre ce problème, nous proposons deux jeux de données réalistes, PETA\textsubscript{$zs$} et RAPv2\textsubscript{$zs$}, suivant le cadre zéro-shot (zero-shot) des identités piétons basé sur les jeux de données PETA et RAPv2. De plus, par rapport à notre méthode de référence performante, nous avons constaté que les méthodes récentes de pointe ne parviennent pas à améliorer les performances sur PETA, RAPv2, PETA\textsubscript{$zs$} et RAPv2\textsubscript{$zs$}. Ainsi, en résolvant le déséquilibre inhérent des attributs dans la reconnaissance des attributs piétons, une méthode efficace est proposée pour améliorer davantage les performances. Les expériences menées sur les jeux de données existants et proposés confirment la supériorité de notre méthode en atteignant des performances de pointe.