HyperAIHyperAI

Command Palette

Search for a command to run...

Bongard-HOI : Une évaluation du raisonnement visuel à faibles exemples pour les interactions homme-objet

Huaizu Jiang Xiaojian Ma Weili Nie Zhiding Yu Yuke Zhu Song-Chun Zhu Anima Anandkumar

Résumé

Un écart important subsiste entre les modèles actuels de reconnaissance de motifs visuels et la cognition visuelle humaine, notamment en ce qui concerne l'apprentissage peu supervisé (few-shot learning) et le raisonnement compositionnel de concepts nouveaux. Nous introduisons Bongard-HOI, un nouveau benchmark de raisonnement visuel axé sur l'apprentissage compositionnel des interactions homme-objet (HOIs) à partir d'images naturelles. Ce benchmark s'inspire de deux caractéristiques souhaitables des problèmes classiques de Bongard (BPs) : 1) l'apprentissage de concepts en peu d'exemples, et 2) le raisonnement dépendant du contexte. Nous avons soigneusement constitué des instances en peu d'exemples incluant des exemples négatifs difficiles, où les images positives et négatives ne diffèrent que par leurs étiquettes d'action, rendant ainsi insuffisante une simple reconnaissance des catégories d'objets pour réussir ce benchmark. Nous avons également conçu plusieurs jeux de test afin d'étudier systématiquement la généralisation des modèles de reconnaissance visuelle, en variant le chevauchement des concepts HOI entre les jeux d'entraînement et de test des instances en peu d'exemples, allant d'un chevauchement partiel à l'absence totale de chevauchement. Bongard-HOI pose un défi considérable aux modèles actuels de reconnaissance visuelle : le modèle d'état de l'art pour la détection d'HOIs atteint seulement 62 % de précision sur une tâche de prédiction binaire en peu d'exemples, tandis que des participants humains amateurs sur MTurk atteignent 91 %. Avec ce benchmark Bongard-HOI, nous espérons stimuler davantage les recherches en raisonnement visuel, en particulier dans les systèmes intégrés de perception-raisonnement et dans l'apprentissage de représentations améliorées.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp