2달 전

중첩 NER를 위한 선형화된 신경망 아키텍처

Jana Straková; Milan Straka; Jan Hajič
중첩 NER를 위한 선형화된 신경망 아키텍처
초록

중첩된 명명된 개체 인식(NER)을 위한 두 가지 신경망 아키텍처를 제안합니다. 이 설정에서는 명명된 개체가 겹칠 수 있으며 하나 이상의 라벨로 표시될 수 있습니다. 우리는 중첩 라벨을 선형화된 방식으로 인코딩합니다. 첫 번째 제안 방법에서는 중첩 라벨의 카르테시안 곱에 해당하는 다중 라벨로 중첩 라벨을 모델링하여 표준 LSTM-CRF 아키텍처에서 이를 구현합니다. 두 번째 방법에서는 중첩 NER을 시퀀스-투-시퀀스 문제로 간주하며, 입력 시퀀스는 토큰으로 구성되고 출력 시퀀스는 라벨로 구성되며, 예측되는 단어의 라벨에 대한 하드 어텐션(hard attention)을 사용합니다.제안된 방법들은 ACE-2004, ACE-2005, GENIA 및 체코 CNEC 네 가지 말뭉치에서 중첩 NER의 최신 기술(state of the art)을 초월하는 성능을 보입니다. 또한 최근 발표된 문맥적 임베딩(contextual embeddings): ELMo, BERT 및 Flair를 우리의 아키텍처에 추가하여 네 가지 중첩 개체 말뭉치에서 더욱 향상된 결과를 얻었습니다. 더불어 CoNLL-2002 네덜란드어와 스페인어, 그리고 CoNLL-2003 영어에 대한 평면 NER(flat NER)의 최신 기술 결과도 보고합니다.

중첩 NER를 위한 선형화된 신경망 아키텍처 | 최신 연구 논문 | HyperAI초신경