HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 3 mois

Amélioration de la Prédiction des Classes Minoritaires Ciblées dans l'Extraction de Relations au Niveau des Phrases

{Yong-Suk Choi Hyeong-Ryeol Baek}

Résumé

L'extraction de relations au niveau des phrases (RE) présente une distribution de données fortement déséquilibrée : environ 80 % des données sont étiquetées comme négatives, c’est-à-dire sans relation, tandis que certaines étiquettes positives correspondent à des classes minoritaires (MC), et certains exemples de ces classes minoritaires sont incorrectement étiquetés. En raison de ces défis — bruit d’étiquetage et faible disponibilité des données sources — la plupart des modèles échouent à apprendre efficacement les classes minoritaires, obtenant des scores F1 nuls ou très faibles sur celles-ci. Les études antérieures se sont plutôt concentrées sur les scores F1 micro, laissant les classes minoritaires insuffisamment traitées. Pour réduire les erreurs de classification élevées sur les classes minoritaires, nous proposons (1) un module d’attention pour les classes minoritaires (MCAM), et (2) des méthodes d’augmentation efficaces spécifiquement conçues pour la RE. Le MCAM calcule des scores de confiance sur les instances des classes minoritaires afin de sélectionner celles qui sont fiables pour l’augmentation, tout en regroupant les informations relatives aux classes minoritaires durant l’entraînement du modèle. Nos expérimentations montrent que notre approche atteint des scores F1 de pointe sur TACRED, tout en améliorant de manière significative le score F1 des classes minoritaires.

Benchmarks

BenchmarkMéthodologieMétriques
relation-extraction-on-tacredRE-MC
F1: 75.4

Construire l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.

Co-codage IA
GPU prêts à utiliser
Meilleurs prix
Commencer

Hyper Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Amélioration de la Prédiction des Classes Minoritaires Ciblées dans l'Extraction de Relations au Niveau des Phrases | Articles de recherche | HyperAI