HyperAIHyperAI

Command Palette

Search for a command to run...

Classification paramétrique pour la découverte de catégories généralisées : une étude de base

Xin Wen Bingchen Zhao Xiaojuan Qi

Résumé

La découverte de catégories généralisée (GCD) vise à identifier de nouvelles catégories dans des ensembles de données non étiquetés en utilisant les connaissances acquises à partir d'échantillons étiquetés. Les études précédentes soutenaient que les classifieurs paramétriques sont sujets au surapprentissage des catégories observées et recommandaient l'utilisation d'un classifieur non paramétrique basé sur un k-means semi-supervisé. Cependant, dans cette étude, nous examinons les raisons du manque de performance des classifieurs paramétriques, vérifions l'efficacité des choix de conception antérieurs lorsque la supervision est de haute qualité, et identifions les pseudo-étiquettes non fiables comme un problème majeur. Nous montrons qu'il existe deux biais de prédiction : le classifieur a tendance à prédire plus souvent les classes observées et produit une distribution déséquilibrée entre les catégories observées et nouvelles. Sur la base de ces résultats, nous proposons une méthode simple mais efficace de classification paramétrique qui bénéficie d'une régularisation par l'entropie, atteint des performances de pointe sur plusieurs benchmarks GCD et montre une forte robustesse face au nombre inconnu de classes. Nous espérons que cette enquête et le cadre simple proposé pourront servir de ligne de base solide pour faciliter les futures recherches dans ce domaine. Notre code est disponible à l'adresse suivante : https://github.com/CVMI-Lab/SimGCD.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp