HyperAIHyperAI

Command Palette

Search for a command to run...

PromptRank : Extraction non supervisée de mots-clés à l'aide de prompts

Aobo Kong Shiwan Zhao Hao Chen Qicheng Li Yong Qin Ruiqi Sun Xiaoyan Bai

Résumé

La tâche d'extraction de mots-clés consiste à sélectionner automatiquement des phrases à partir d'un document donné afin de résumer son contenu principal. Des performances récentes de pointe (SOTA) ont été obtenues grâce à des algorithmes basés sur des embeddings, qui classent les candidats en fonction de leur similarité avec l'embedding du document. Toutefois, de telles approches peinent soit à gérer les écarts de longueur entre le document et les candidats, soit à exploiter pleinement le modèle linguistique pré-entraîné (PLM) sans une phase de fine-tuning supplémentaire. À cet effet, dans cet article, nous proposons une approche non supervisée simple mais efficace, appelée PromptRank, fondée sur un PLM à architecture encodeur-décodeur. Plus précisément, PromptRank introduit le document dans l'encodeur et calcule la probabilité de génération du candidat par le décodeur, à l’aide d’un prompt conçu spécifiquement. Nous évaluons de manière exhaustive PromptRank sur six benchmarks largement utilisés. PromptRank surpasser l’approche SOTA MDERank, en améliorant respectivement le score F1 de 34,18 %, 24,87 % et 17,57 % pour 5, 10 et 15 résultats retournés. Ces résultats démontrent le grand potentiel de l’utilisation du prompt pour l’extraction non supervisée de mots-clés. Nous mettons à disposition notre code à l’adresse suivante : https://github.com/HLT-NLP/PromptRank.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp