HyperAIHyperAI
il y a 2 mois

Vous ne maîtrisez qu'une seule requête : Apprentissage d'une requête humaine unifiée pour la perception centrée sur l'humain à une seule étape, multi-personnes et multi-tâches

Jin, Sheng ; Li, Shuhuai ; Li, Tong ; Liu, Wentao ; Qian, Chen ; Luo, Ping
Vous ne maîtrisez qu'une seule requête : Apprentissage d'une requête humaine unifiée pour la perception centrée sur l'humain à une seule étape, multi-personnes et multi-tâches
Résumé

La perception centrée sur l'humain (par exemple, la détection, la segmentation, l'estimation de posture et l'analyse d'attributs) est un problème de longue date pour la vision par ordinateur. Cet article présente un cadre unifié et polyvalent (HQNet) pour la perception centrée sur l'humain (HCP) multi-tâche et multi-personnes en une seule étape. Notre approche se concentre sur l'apprentissage d'une représentation unifiée de requête humaine, notée Human Query, qui capture des caractéristiques complexes au niveau des instances pour chaque individu et dissocie des scénarios multi-personnes complexes. Bien que les différentes tâches de HCP aient été bien étudiées individuellement, l'apprentissage multi-tâche en une seule étape de ces tâches n'a pas encore été pleinement exploité dans la littérature en raison de l'absence d'un jeu de données de référence complet. Pour combler cette lacune, nous proposons le benchmark COCO-UniHuman afin de faciliter le développement des modèles et leur évaluation complète.Les résultats expérimentaux montrent que la méthode proposée offre des performances de pointe parmi les modèles HCP multi-tâche et des performances compétitives comparées aux modèles HCP spécifiques à une tâche. De plus, nos expériences soulignent l'adaptabilité du Human Query à de nouvelles tâches HCP, démontrant ainsi sa capacité généralisée robuste. Les codes source et les données sont disponibles à l'adresse suivante : https://github.com/lishuhuai527/COCO-UniHuman.

Vous ne maîtrisez qu'une seule requête : Apprentissage d'une requête humaine unifiée pour la perception centrée sur l'humain à une seule étape, multi-personnes et multi-tâches | Articles de recherche récents | HyperAI