17일 전

로마니아 법적 분야에서의 명명된 엔터티 인식

{Alexandru Ianov, Vlad Coneschi, Carol Luca Gasan, Maria Mitrofan, Vasile Pais}
로마니아 법적 분야에서의 명명된 엔터티 인식
초록

텍스트 내에 포함된 명명된 실체(Named Entities)를 인식하는 것은 정보 추출 및 자연어 이해를 위한 중요한 단계이다. 본 연구는 루마니아 법률 분야를 대상으로 한 명명된 실체 인식(Named Entity Recognition, NER) 시스템을 제안한다. 이 시스템은 골드 레이블이 부여된 LegalNERo 코퍼스를 활용하며, 대규모 법률 분야 코퍼스를 기반으로 학습된 워드 임베딩을 포함한 다양한 분포적 단어 표현(distributional representations)을 결합한다. 모든 자원—코퍼스, 모델, 워드 임베딩 등—은 오픈 소스로 공개된다. 또한 최적의 시스템은 RELATE 플랫폼에서 직접 사용할 수 있다.