HyperAIHyperAI

Command Palette

Search for a command to run...

Propagation de Labels pour la Classification Zero-shot avec des Modèles Vision-Langue

Stojnić Vladan ; Kalantidis Yannis ; Tolias Giorgos

Résumé

Les modèles Vision-Langage (VLMs) ont démontré des performances impressionnantes en classification à zéro coup d'œil, c'est-à-dire la classification lorsqu'on ne fournit qu'une liste de noms de classes. Dans cet article, nous abordons le cas de la classification à zéro coup d'œil en présence de données non étiquetées. Nous exploitons la structure graphique des données non étiquetées et introduisons ZLaP, une méthode basée sur la propagation des labels (LP) qui utilise les distances géodésiques pour la classification. Nous adaptons LP aux graphes contenant à la fois des caractéristiques textuelles et visuelles, et proposons en outre une méthode efficace pour effectuer l'inférence inductive basée sur une solution duale et une étape de raréfaction. Nous menons des expériences approfondies pour évaluer l'efficacité de notre méthode sur 14 jeux de données courants et montrons que ZLaP surpassent les travaux les plus récents dans ce domaine. Code : https://github.com/vladan-stojnic/ZLaP


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp