17일 전

FLERT: 이름 있는 엔터티 인식을 위한 문서 수준 특징

Stefan Schweter, Alan Akbik
FLERT: 이름 있는 엔터티 인식을 위한 문서 수준 특징
초록

최근의 명명된 실체 인식(NER) 기술에서 일반적으로 사용되는 접근 방식은 문장 수준의 텍스트를 고려하기 때문에 문장 경계를 넘는 정보를 모델링하지 못한다. 그러나 트랜스포머 기반 모델을 활용하면 문서 수준의 특징을 자연스럽게 포착할 수 있는 가능성이 있다. 본 연구에서는 문헌에서 일반적으로 다뤄지는 두 가지 표준 NER 아키텍처인 '피팅 조정(fine-tuning)'과 '특징 기반 LSTM-CRF'에 대해 문서 수준의 특징을 비교 평가한다. 또한 문서 수준 특징에 대한 다양한 하이퍼파라미터, 예를 들어 컨텍스트 창 크기와 문서 내 국소성(document-locality) 강제 적용 여부를 평가한다. 이를 통해 문서 맥락을 어떻게 모델링할지에 대한 권고 사항을 도출하고, 여러 CoNLL-03 벤치마크 데이터셋에서 새로운 최고 성능 기록을 달성한다. 본 연구의 방법은 실험 재현을 용이하게 하기 위해 Flair 프레임워크에 통합되었다.

FLERT: 이름 있는 엔터티 인식을 위한 문서 수준 특징 | 최신 연구 논문 | HyperAI초신경