il y a 7 mois

Résumé

Nous abordons la classification de texte multi-étiquette à grande échelle (LMTC) dans le domaine juridique. Nous mettons à disposition un nouveau jeu de données composé de 57 000 documents législatifs provenant d'EURLEX, annotés avec environ 4 300 étiquettes EUROVOC, qui convient pour la LMTC ainsi que pour l'apprentissage par peu d'exemples et l'apprentissage sans exemple. En expérimentant avec plusieurs classifieurs neuronaux, nous démontrons que les BIGRUs avec attention par étiquette se comportent mieux que les autres méthodes actuelles de pointe. Les plongements (embeddings) spécifiques au domaine basés sur WORD2VEC et les plongements contextuels ELMO améliorent encore davantage les performances. Nous constatons également qu'il suffit de considérer uniquement certaines zones des documents. Cela nous permet de contourner la limite maximale de longueur du texte imposée par BERT et d'affiner l'ajustement de BERT, obtenant les meilleurs résultats dans tous les cas sauf celui de l'apprentissage sans exemple.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Traitement Du Langage Naturel

Transformer

Compréhension De Document

Approche/Framework

Traitement Du Langage Naturel

Tâche

Ilias Chalkidis Manos Fergadiotis Prodromos Malakasiotis Ion Androutsopoulos

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 7 mois

Traitement Du Langage Naturel

Transformer

Compréhension De Document

Approche/Framework

Traitement Du Langage Naturel

Tâche

Ilias Chalkidis Manos Fergadiotis Prodromos Malakasiotis Ion Androutsopoulos

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Classification multi-étiquette à grande échelle du texte législatif de l'UE

Ilias Chalkidis Manos Fergadiotis Prodromos Malakasiotis Ion Androutsopoulos

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Classification multi-étiquette à grande échelle du texte législatif de l'UE

Ilias Chalkidis Manos Fergadiotis Prodromos Malakasiotis Ion Androutsopoulos

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Classification multi-étiquette à grande échelle du texte législatif de l'UE

Ilias Chalkidis Manos Fergadiotis Prodromos Malakasiotis Ion Androutsopoulos

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters