HyperAIHyperAI
il y a 7 jours

PromptRank : Extraction non supervisée de mots-clés à l'aide de prompts

Aobo Kong, Shiwan Zhao, Hao Chen, Qicheng Li, Yong Qin, Ruiqi Sun, Xiaoyan Bai
PromptRank : Extraction non supervisée de mots-clés à l'aide de prompts
Résumé

La tâche d'extraction de mots-clés consiste à sélectionner automatiquement des phrases à partir d'un document donné afin de résumer son contenu principal. Des performances récentes de pointe (SOTA) ont été obtenues grâce à des algorithmes basés sur des embeddings, qui classent les candidats en fonction de leur similarité avec l'embedding du document. Toutefois, de telles approches peinent soit à gérer les écarts de longueur entre le document et les candidats, soit à exploiter pleinement le modèle linguistique pré-entraîné (PLM) sans une phase de fine-tuning supplémentaire. À cet effet, dans cet article, nous proposons une approche non supervisée simple mais efficace, appelée PromptRank, fondée sur un PLM à architecture encodeur-décodeur. Plus précisément, PromptRank introduit le document dans l'encodeur et calcule la probabilité de génération du candidat par le décodeur, à l’aide d’un prompt conçu spécifiquement. Nous évaluons de manière exhaustive PromptRank sur six benchmarks largement utilisés. PromptRank surpasser l’approche SOTA MDERank, en améliorant respectivement le score F1 de 34,18 %, 24,87 % et 17,57 % pour 5, 10 et 15 résultats retournés. Ces résultats démontrent le grand potentiel de l’utilisation du prompt pour l’extraction non supervisée de mots-clés. Nous mettons à disposition notre code à l’adresse suivante : https://github.com/HLT-NLP/PromptRank.

PromptRank : Extraction non supervisée de mots-clés à l'aide de prompts | Articles de recherche récents | HyperAI