HyperAIHyperAI
il y a 2 mois

Classification paramétrique pour la découverte de catégories généralisées : une étude de base

Xin Wen; Bingchen Zhao; Xiaojuan Qi
Classification paramétrique pour la découverte de catégories généralisées : une étude de base
Résumé

La découverte de catégories généralisée (GCD) vise à identifier de nouvelles catégories dans des ensembles de données non étiquetés en utilisant les connaissances acquises à partir d'échantillons étiquetés. Les études précédentes soutenaient que les classifieurs paramétriques sont sujets au surapprentissage des catégories observées et recommandaient l'utilisation d'un classifieur non paramétrique basé sur un k-means semi-supervisé. Cependant, dans cette étude, nous examinons les raisons du manque de performance des classifieurs paramétriques, vérifions l'efficacité des choix de conception antérieurs lorsque la supervision est de haute qualité, et identifions les pseudo-étiquettes non fiables comme un problème majeur. Nous montrons qu'il existe deux biais de prédiction : le classifieur a tendance à prédire plus souvent les classes observées et produit une distribution déséquilibrée entre les catégories observées et nouvelles. Sur la base de ces résultats, nous proposons une méthode simple mais efficace de classification paramétrique qui bénéficie d'une régularisation par l'entropie, atteint des performances de pointe sur plusieurs benchmarks GCD et montre une forte robustesse face au nombre inconnu de classes. Nous espérons que cette enquête et le cadre simple proposé pourront servir de ligne de base solide pour faciliter les futures recherches dans ce domaine. Notre code est disponible à l'adresse suivante : https://github.com/CVMI-Lab/SimGCD.

Classification paramétrique pour la découverte de catégories généralisées : une étude de base | Articles de recherche récents | HyperAI