HyperAIHyperAI
il y a 2 mois

Maverick : Résolution de Co-référence Efficace et Précise Défiant les Tendances Récentes

Giuliano Martinelli; Edoardo Barba; Roberto Navigli
Maverick : Résolution de Co-référence Efficace et Précise Défiant les Tendances Récentes
Résumé

Les grands modèles génératifs auto-régressifs sont apparus comme la pierre angulaire pour atteindre les meilleures performances dans plusieurs tâches de traitement du langage naturel (Natural Language Processing, NLP). Cependant, le désir d'obtenir des résultats supérieurs a parfois conduit à un remplacement prématuré des approches spécifiques à chaque tâche soigneusement conçues, sans expérimentation exhaustive. La tâche de résolution de co-référence n'est pas une exception ; toutes les solutions récentes de pointe adoptent des grands modèles génératifs auto-régressifs qui surpassent les systèmes discriminants basés sur des encodeurs. Dans cette étude, nous remettons en question cette tendance récente en introduisant Maverick, une pipeline soigneusement conçue mais simple, permettant de faire fonctionner un système de résolution de co-référence d'avant-garde dans le cadre d'un budget académique, surpassant des modèles dotés jusqu'à 13 milliards de paramètres avec seulement 500 millions de paramètres. Maverick atteint des performances d'avant-garde sur le benchmark CoNLL-2012, en s'entraînant avec jusqu'à 0,006 fois moins de ressources mémoire et en obtenant une inférence 170 fois plus rapide que les systèmes précédents d'avant-garde. Nous validons rigoureusement la robustesse du cadre Maverick grâce à une série d'expériences diverses, rapportant des améliorations par rapport aux systèmes antérieurs dans les contextes où les données sont rares, les documents sont longs et hors domaine. Nous mettons notre code et nos modèles à disposition pour des fins de recherche sur https://github.com/SapienzaNLP/maverick-coref.

Maverick : Résolution de Co-référence Efficace et Précise Défiant les Tendances Récentes | Articles de recherche récents | HyperAI