il y a 8 mois

Résumé

Les grands modèles génératifs auto-régressifs sont apparus comme la pierre angulaire pour atteindre les meilleures performances dans plusieurs tâches de traitement du langage naturel (Natural Language Processing, NLP). Cependant, le désir d'obtenir des résultats supérieurs a parfois conduit à un remplacement prématuré des approches spécifiques à chaque tâche soigneusement conçues, sans expérimentation exhaustive. La tâche de résolution de co-référence n'est pas une exception ; toutes les solutions récentes de pointe adoptent des grands modèles génératifs auto-régressifs qui surpassent les systèmes discriminants basés sur des encodeurs. Dans cette étude, nous remettons en question cette tendance récente en introduisant Maverick, une pipeline soigneusement conçue mais simple, permettant de faire fonctionner un système de résolution de co-référence d'avant-garde dans le cadre d'un budget académique, surpassant des modèles dotés jusqu'à 13 milliards de paramètres avec seulement 500 millions de paramètres. Maverick atteint des performances d'avant-garde sur le benchmark CoNLL-2012, en s'entraînant avec jusqu'à 0,006 fois moins de ressources mémoire et en obtenant une inférence 170 fois plus rapide que les systèmes précédents d'avant-garde. Nous validons rigoureusement la robustesse du cadre Maverick grâce à une série d'expériences diverses, rapportant des améliorations par rapport aux systèmes antérieurs dans les contextes où les données sont rares, les documents sont longs et hors domaine. Nous mettons notre code et nos modèles à disposition pour des fins de recherche sur https://github.com/SapienzaNLP/maverick-coref.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Traitement Du Langage Naturel

LLM

Transformer

Approche/Framework

Traitement Du Langage Naturel

Tâche

Giuliano Martinelli; Edoardo Barba; Roberto Navigli

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Traitement Du Langage Naturel

LLM

Transformer

Approche/Framework

Traitement Du Langage Naturel

Tâche

Giuliano Martinelli; Edoardo Barba; Roberto Navigli

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Maverick : Résolution de Co-référence Efficace et Précise Défiant les Tendances Récentes

Giuliano Martinelli; Edoardo Barba; Roberto Navigli

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Maverick : Résolution de Co-référence Efficace et Précise Défiant les Tendances Récentes

Giuliano Martinelli; Edoardo Barba; Roberto Navigli

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Maverick : Résolution de Co-référence Efficace et Précise Défiant les Tendances Récentes

Giuliano Martinelli; Edoardo Barba; Roberto Navigli

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters