HyperAIHyperAI

Command Palette

Search for a command to run...

Embeddings universels améliorés grâce à l’apprentissage contrastif basé sur les prompts et l’apprentissage fondé sur l’énergie

Yuxin Jiang Linhan Zhang Wei Wang

Résumé

L’apprentissage contrastif s’est révélé efficace pour améliorer les modèles linguistiques pré-entraînés (PLM) afin d’obtenir des représentations universelles de phrases de haute qualité. Toutefois, les méthodes contrastives existantes présentent encore deux limites. Premièrement, les travaux antérieurs peuvent obtenir de mauvaises performances dans des scénarios de décalage de domaine, ce qui entrave leur application pratique. Nous attribuons cette faible performance à l’over-paramétrisation des PLM, qui comptent des millions de paramètres. Pour atténuer ce problème, nous proposons PromCSE (apprentissage contrastif basé sur les prompts pour les représentations de phrases), qui n’entraîne qu’un petit ensemble de Soft Prompt (c’est-à-dire un ensemble de vecteurs entraînables) tout en maintenant les PLM fixes. Deuxièmement, la fonction de perte NT-Xent couramment utilisée dans l’apprentissage contrastif n’exploite pas pleinement les exemples négatifs difficiles dans les cadres d’apprentissage supervisé. À cet effet, nous proposons d’intégrer une perte à hinge basée sur l’énergie, inspirée du lien entre la fonction NT-Xent et le paradigme d’apprentissage basé sur l’énergie, afin d’améliorer la capacité discriminative par paire. Les résultats expérimentaux sur sept tâches standards de similarité sémantique de texte (STS) ainsi qu’une tâche STS soumise à un décalage de domaine démontrent l’efficacité de notre méthode par rapport aux modèles d’état de l’art actuels pour les représentations de phrases. Notre code est disponible publiquement à l’adresse suivante : https://github.com/YJiangcm/PromCSE


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp