HyperAIHyperAI
il y a 11 jours

Apprentissage conjoint de plongements hyperboliques pour les étiquettes dans le cadre de la classification multi-label hiérarchique

Soumya Chatterjee, Ayush Maheshwari, Ganesh Ramakrishnan, Saketha Nath Jagaralpudi
Apprentissage conjoint de plongements hyperboliques pour les étiquettes dans le cadre de la classification multi-label hiérarchique
Résumé

Nous considérons le problème de la classification multi-étiquettes où les étiquettes sont organisées selon une hiérarchie. Toutefois, contrairement à la plupart des travaux existants en classification multi-étiquettes hiérarchiques, nous ne supposons pas que la hiérarchie des étiquettes est connue a priori. Inspirés par les récents succès des embeddings hyperboliques dans la capture des relations hiérarchiques, nous proposons d’apprendre conjointement les paramètres du classificateur et les embeddings des étiquettes. Ce cadre d’apprentissage conjoint devrait offrir un double avantage : i) le classificateur généralise mieux grâce à l’exploitation des connaissances a priori sur l’existence d’une hiérarchie parmi les étiquettes ; ii) en plus des informations de co-occurrence des étiquettes, les embeddings peuvent tirer parti de la structure de variété des points de données d’entrée, conduisant à des représentations plus fidèles à la hiérarchie réelle. Nous proposons une nouvelle formulation pour cet apprentissage conjoint et évaluons empiriquement son efficacité. Les résultats montrent que l’apprentissage conjoint surpasse la méthode de référence basée sur des embeddings hyperboliques pré-entraînés à partir de la co-occurrence des étiquettes. De plus, les classificateurs proposés atteignent des performances de généralisation de pointe sur des benchmarks standards. Nous présentons également une évaluation des embeddings hyperboliques obtenus par apprentissage conjoint, et montrons qu’ils représentent la hiérarchie de manière plus précise que les autres approches alternatives.

Apprentissage conjoint de plongements hyperboliques pour les étiquettes dans le cadre de la classification multi-label hiérarchique | Articles de recherche récents | HyperAI