Reconnaissance d'Entités Nommées (NER)
La Reconnaissance d'Entités Nommées (NER) est une tâche en Traitement Automatique des Langues (TAL) visant à identifier et classifier les entités nommées dans le texte dans des catégories prédéfinies telles que noms de personnes, organisations, lieux, etc. Son objectif est d'extraire des informations structurées à partir de données textuelles non structurées et de les représenter sous un format lisible par machine. La NER a une valeur d'application importante dans des domaines tels que la recherche d'informations, la construction de graphes de connaissances, l'analyse de sentiments, et utilise généralement le schéma d'étiquetage BIO pour distinguer le début et l'intérieur des marquages d'entités.
CoNLL 2003 (English)
ACE + document-context
Ontonotes v5 (English)
BERT-MRC+DSC
NCBI-disease
WNUT 2017
CL-KL
ACE 2005
Ours: cross-sentence ALB
JNLPBA
Spark NLP
BC5CDR
BINDER
GENIA
BC2GM
BioLinkBERT (large)
BC5CDR-chemical
SciFive-Large
SLUE
W2V2-L-LL60K (pipeline approach, uses LM)
CoNLL++
LUKE(Large)
BC5CDR-disease
BioMegatron
ACE 2004
Ours: cross-sentence ALB
SciERC
SpERT
BC4CHEMD
BLSTM-CNN-Char (SparkNLP)
WNUT 2016
HGN
CoNLL 2002 (Spanish)
CoNLL 2002 (Dutch)
ACE
CoNLL 2003 (German)
Few-NERD (SUP)
PL-Marker
LINNAEUS
BLSTM-CNN-Char (SparkNLP)
AnatEM
BLSTM-CNN-Char (SparkNLP)
CoNLL 2003 (German) Revised
ACE + document-context
CoNLL03
LS-unLLaMA
Species-800
BioBERT
CORD-r
FUNSD-r
SemClinBr
BioNLP13-CG
BLSTM-CNN-Char (SparkNLP)
BioRED
PubMedBERT-CRF
DWIE
FindVehicle
BiLSTM-CRF
NEMO-Corpus (morph,test)
OntoNotes
WNUT 2020
mgsohrab
CoNLL-2020
LUKE + SubRegWeigh (K-means)
ACE2005
DeepStruct multi-task w/ finetune
BC7 NLM-Chem
CMeEE
BERT-CRF (Replicated in AdaSeq)
DaNE
HiNER-collapsed
HiNER-original
cfilt/HiNER-original-xlm-roberta-large
NEMO-Corpus (token,test)
AlephBERT-base
OntoNotes 5.0
HGN
Species800
BLSTM-CNN-Char (SparkNLP)
WLPC
DyGIE
NEMO-Corpus
UNER v1 (Danish)
UNER XML-R
UNER v1 (English)
UNER v1 (Croatian)
UNER v1 (Portuguese)
UNER v1 (Slovak)
UNER v1 (Serbian)
UNER v1 (Swedish)
UNER v1 (Chinese)
UNER v1 (Chinese Simplified)
UNER v1 - PUD (English)
UNER v1 - PUD (Portuguese)
UNER v1 - PUD (Swedish)
UNER v1 - PUD (Chinese)
WetLab
BiLSTM-CRF with ELMo
Adverse Drug Events (ADE) Corpus
Broad Twitter Corpus
Code-Switching English-Spanish NER
HME (word + BPE + char)
CoNLL 2000
SWEM-CRF
French Treebank
Gellus
ConNER
i2b2 De-identification Dataset
BiLSTM with ELMo
IECSIL FIRE-2018 Shared Task
XLM-RoBERTa
LegalNERo
Marcell
LeNER-Br
LSTM-CRF
MasakhaNER
BERT
NCBI Disease
UniNER-7B
SemEval 2022 - BanglaCoNER
SemEval 2022-2023 - BanglaCoNER
FT-Bangla BERT Large
SoSciSoCi