HyperAIHyperAI

Command Palette

Search for a command to run...

DiffCSE : Apprentissage contrastif basé sur les différences pour les embeddings de phrases

Yung-Sung Chuang Rumen Dangovski Hongyin Luo Yang Zhang Shiyu Chang Marin Soljačić Shang-Wen Li Wen-tau Yih Yoon Kim James Glass

Résumé

Nous proposons DiffCSE, un cadre d'apprentissage contrastif non supervisé destiné à l'apprentissage d'embeddings de phrases. DiffCSE apprend des embeddings de phrases sensibles aux différences entre une phrase originale et une phrase modifiée, où celle-ci est obtenue en masquant de manière stochastique la phrase d'origine, puis en échantillonnant à partir d'un modèle langagier masqué. Nous montrons que DiffCSE constitue un cas particulier de l'apprentissage contrastif équivariant (Dangovski et al., 2021), une généralisation de l'apprentissage contrastif qui permet d'apprendre des représentations insensibles à certains types d'augmentations, tout en restant sensibles à d'autres types d'augmentations jugées « nuisibles ». Nos expériences montrent que DiffCSE atteint des résultats de pointe parmi les méthodes non supervisées d'apprentissage de représentations de phrases, surpassant SimCSE non supervisé de 2,3 points absolus sur les tâches de similarité sémantique entre textes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DiffCSE : Apprentissage contrastif basé sur les différences pour les embeddings de phrases | Articles | HyperAI