il y a 8 mois

Résumé

BERT adopte le modèle de langage masqué (MLM) pour l'entraînement préalable et est l'un des modèles d'entraînement préalable les plus réussis. Comme BERT néglige la dépendance entre les jetons prédits, XLNet introduit le modèle de langage permuté (PLM) pour l'entraînement préalable afin de résoudre ce problème. Cependant, XLNet ne tire pas pleinement parti des informations de position d'une phrase, ce qui entraîne une discordance de position entre l'entraînement préalable et le réglage fin. Dans cet article, nous proposons MPNet, une nouvelle méthode d'entraînement préalable qui hérite des avantages de BERT et XLNet tout en évitant leurs limitations. MPNet utilise la dépendance entre les jetons prédits grâce au modèle de langage permuté (contrairement à MLM dans BERT) et prend en compte des informations de position auxiliaires en entrée pour permettre au modèle de voir une phrase complète, réduisant ainsi la discordance de position (contrairement à PLM dans XLNet). Nous entraînons préalablement MPNet sur un ensemble de données à grande échelle (plus de 160 Go de corpus textuels) et effectuons un réglage fin sur diverses tâches en aval (GLUE, SQuAD, etc.). Les résultats expérimentaux montrent que MPNet surpasse largement MLM et PLM, et obtient des résultats supérieurs à ceux des méthodes d'entraînement préalable précédentes (comme BERT, XLNet, RoBERTa) sous les mêmes conditions de modèle. Le code source et les modèles pré-entraînés sont disponibles à l'adresse suivante : https://github.com/microsoft/MPNet.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Transformer

Traitement Du Langage Naturel

LLM

Approche/Framework

Traitement Du Langage Naturel

Tâche

Kaitao Song Xu Tan Tao Qin Jianfeng Lu Tie-Yan Liu

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Transformer

Traitement Du Langage Naturel

LLM

Approche/Framework

Traitement Du Langage Naturel

Tâche

Kaitao Song Xu Tan Tao Qin Jianfeng Lu Tie-Yan Liu

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

MPNet : Pré-entraînement masqué et permuté pour la compréhension linguistique | Articles | HyperAI

Command Palette

MPNet : Pré-entraînement masqué et permuté pour la compréhension linguistique

Kaitao Song Xu Tan Tao Qin Jianfeng Lu Tie-Yan Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

MPNet : Pré-entraînement masqué et permuté pour la compréhension linguistique

Kaitao Song Xu Tan Tao Qin Jianfeng Lu Tie-Yan Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

MPNet : Pré-entraînement masqué et permuté pour la compréhension linguistique

Kaitao Song Xu Tan Tao Qin Jianfeng Lu Tie-Yan Liu

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters