HyperAIHyperAI

Command Palette

Search for a command to run...

명명된 실체 인식 (NER)

Named Entity Recognition (NER)는 자연어 처리(NLP)의 한 과제로, 텍스트 내의 고유 명사를 사전 정의된 범주(예: 인물 이름, 조직, 위치 등)로 식별하고 분류하는 작업입니다. 이 작업의 목표는 비정형 텍스트 데이터에서 구조화된 정보를 추출하여 기계가 읽을 수 있는 형식으로 표현하는 것입니다. NER은 정보 검색, 지식 그래프 구성, 감성 분석 등의 분야에서 중요한 응용 가치를 가지고 있으며, 일반적으로 BIO 태깅 방식을 사용하여 엔티티 마킹의 시작과 내부를 구분합니다.

CoNLL 2003 (English)
ACE + document-context
Ontonotes v5 (English)
BERT-MRC+DSC
NCBI-disease
WNUT 2017
CL-KL
ACE 2005
Ours: cross-sentence ALB
JNLPBA
Spark NLP
BC5CDR
BINDER
GENIA
BC2GM
BioLinkBERT (large)
BC5CDR-chemical
SciFive-Large
SLUE
W2V2-L-LL60K (pipeline approach, uses LM)
CoNLL++
LUKE(Large)
BC5CDR-disease
BioMegatron
ACE 2004
Ours: cross-sentence ALB
BC4CHEMD
BLSTM-CNN-Char (SparkNLP)
WNUT 2016
HGN
SciERC
SpERT
CoNLL 2002 (Dutch)
ACE
LINNAEUS
BLSTM-CNN-Char (SparkNLP)
Few-NERD (SUP)
PL-Marker
CoNLL 2003 (German)
CoNLL 2002 (Spanish)
CoNLL 2003 (German) Revised
ACE + document-context
Species-800
BioBERT
CoNLL03
LS-unLLaMA
AnatEM
BLSTM-CNN-Char (SparkNLP)
FUNSD-r
CORD-r
DWIE
WNUT 2020
mgsohrab
FindVehicle
BiLSTM-CRF
BioNLP13-CG
BLSTM-CNN-Char (SparkNLP)
BioRED
PubMedBERT-CRF
SemClinBr
OntoNotes
NEMO-Corpus (morph,test)
WLPC
DyGIE
Species800
BLSTM-CNN-Char (SparkNLP)
ACE2005
DeepStruct multi-task w/ finetune
OntoNotes 5.0
HGN
NEMO-Corpus (token,test)
AlephBERT-base
BC7 NLM-Chem
CoNLL-2020
LUKE + SubRegWeigh (K-means)
DaNE
CMeEE
BERT-CRF (Replicated in AdaSeq)
HiNER-collapsed
HiNER-original
cfilt/HiNER-original-xlm-roberta-large
UNER v1 (Serbian)
UNER v1 (Danish)
UNER XML-R
UNER v1 (English)
UNER v1 (Portuguese)
UNER v1 - PUD (Chinese)
UNER v1 - PUD (English)
UNER v1 - PUD (Portuguese)
UNER v1 - PUD (Swedish)
UNER v1 (Chinese)
UNER v1 (Slovak)
UNER v1 (Swedish)
WetLab
BiLSTM-CRF with ELMo
French Treebank
CoNLL 2000
SWEM-CRF
UNER v1 (Croatian)
UNER v1 (Chinese Simplified)
MasakhaNER
BERT
Gellus
ConNER
Code-Switching English-Spanish NER
HME (word + BPE + char)
SoSciSoCi
SemEval 2022 - BanglaCoNER
SemEval 2022-2023 - BanglaCoNER
FT-Bangla BERT Large
Broad Twitter Corpus
i2b2 De-identification Dataset
BiLSTM with ELMo
IECSIL FIRE-2018 Shared Task
XLM-RoBERTa
LegalNERo
Marcell
LeNER-Br
LSTM-CRF
NEMO-Corpus
NCBI Disease
UniNER-7B
Adverse Drug Events (ADE) Corpus