
초록
최근의 명명된 실체 인식(NER) 기술에서 일반적으로 사용되는 접근 방식은 문장 수준의 텍스트를 고려하기 때문에 문장 경계를 넘는 정보를 모델링하지 못한다. 그러나 트랜스포머 기반 모델을 활용하면 문서 수준의 특징을 자연스럽게 포착할 수 있는 가능성이 있다. 본 연구에서는 문헌에서 일반적으로 다뤄지는 두 가지 표준 NER 아키텍처인 '피팅 조정(fine-tuning)'과 '특징 기반 LSTM-CRF'에 대해 문서 수준의 특징을 비교 평가한다. 또한 문서 수준 특징에 대한 다양한 하이퍼파라미터, 예를 들어 컨텍스트 창 크기와 문서 내 국소성(document-locality) 강제 적용 여부를 평가한다. 이를 통해 문서 맥락을 어떻게 모델링할지에 대한 권고 사항을 도출하고, 여러 CoNLL-03 벤치마크 데이터셋에서 새로운 최고 성능 기록을 달성한다. 본 연구의 방법은 실험 재현을 용이하게 하기 위해 Flair 프레임워크에 통합되었다.