HyperAIHyperAI

Command Palette

Search for a command to run...

PatternRank : Exploiter les Modèles Linguistiques Pré-Entraînés et les Parties du Discours pour l'Extraction Non Supervisée de Mots-Clés

Tim Schopf Simon Klimek Florian Matthes

Résumé

L'extraction de mots-clés consiste à sélectionner automatiquement un petit ensemble de phrases les plus pertinentes à partir d’un texte donné. Les approches supervisées d’extraction de mots-clés nécessitent de grandes quantités de données d’entraînement étiquetées et se comportent médiocrement en dehors du domaine des données d’entraînement. Dans cet article, nous présentons PatternRank, une méthode qui exploite les modèles linguistiques préentraînés ainsi que les catégories grammaticales (part-of-speech) pour l’extraction non supervisée de mots-clés à partir de documents individuels. Nos expérimentations montrent que PatternRank atteint des scores de précision, de rappel et de F1 supérieurs à ceux des approches précédemment les plus performantes. En outre, nous introduisons le package KeyphraseVectorizers, qui permet une modification aisée des motifs de catégories grammaticales pour la sélection des candidats mots-clés, facilitant ainsi l’adaptation de notre approche à tout domaine.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp