HyperAIHyperAI
il y a 2 mois

CitePrompt : Utilisation de prompts pour identifier l'intention de citation dans les articles scientifiques

Avishek Lahiri; Debarshi Kumar Sanyal; Imon Mukherjee
CitePrompt : Utilisation de prompts pour identifier l'intention de citation dans les articles scientifiques
Résumé

Les citations dans les articles scientifiques ne servent pas seulement à retracer la filiation intellectuelle, mais constituent également un indicateur utile de la pertinence scientifique du travail. Les intentions de citation sont bénéfiques car elles précisent le rôle de la citation dans un contexte donné. Dans cet article, nous présentons CitePrompt, un cadre qui utilise l'approche jusqu'ici inexplorée de l'apprentissage basé sur des prompts pour la classification des intentions de citation. Nous soutenons que, avec le choix approprié du modèle linguistique préentraîné, du modèle de prompt et du verbalisateur de prompt, nous pouvons non seulement obtenir des résultats supérieurs ou comparables à ceux obtenus par les méthodes d'avant-garde actuelles, mais aussi le faire avec beaucoup moins d'informations externes sur le document scientifique. Nous rapportons des résultats d'avant-garde sur l'ensemble de données ACL-ARC et montrons également une amélioration significative sur l'ensemble de données SciCite par rapport à tous les modèles de base sauf un. Étant donné que des ensembles de données étiquetés suffisamment grands pour la classification des intentions de citation peuvent être difficiles à trouver, nous proposons pour la première fois la conversion de cette tâche aux configurations few-shot (peu d'exemples) et zero-shot (aucun exemple). Pour l'ensemble de données ACL-ARC, nous rapportons un score F1 de 53,86 % dans le cadre zero-shot, qui s'améliore respectivement à 63,61 % et 66,99 % pour les configurations 5-shot et 10-shot.

CitePrompt : Utilisation de prompts pour identifier l'intention de citation dans les articles scientifiques | Articles de recherche récents | HyperAI