HyperAIHyperAI

Command Palette

Search for a command to run...

Détection d'attributs à vocabulaire ouvert

María A. Bravo Sudhanshu Mittal Simon Ging Thomas Brox

Résumé

Le modèle de vision-langue a permis la réalisation de tâches à vocabulaire ouvert où des prédictions peuvent être interrogées à l'aide de tout texte-prompt de manière zéro-shot. Les tâches existantes à vocabulaire ouvert se concentrent sur les classes d'objets, tandis que les recherches sur les attributs d'objets sont limitées en raison du manque d'un benchmark d'évaluation fiable axé sur les attributs. Cet article introduit la tâche de détection d'attributs à vocabulaire ouvert (OVAD) et le benchmark OVAD correspondant. L'objectif de cette nouvelle tâche et de ce benchmark est d'examiner les informations sur les attributs au niveau des objets apprises par les modèles de vision-langue. À cet effet, nous avons créé un ensemble de test propre et dense couvrant 117 classes d'attributs sur les 80 classes d'objets de MS COCO. Il inclut des annotations positives et négatives, ce qui permet une évaluation à vocabulaire ouvert. Dans son ensemble, le benchmark comprend 1,4 million d'annotations. Pour référence, nous fournissons une première méthode de base pour la détection d'attributs à vocabulaire ouvert. De plus, nous démontrons la valeur du benchmark en étudiant les performances de détection d'attributs de plusieurs modèles fondamentaux. Page du projet : https://ovad-benchmark.github.io


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Détection d'attributs à vocabulaire ouvert | Articles | HyperAI