11일 전
트르쿠 뉴럴 파서 파이프라인: CoNLL 2018 공동 과제를 위한 엔드투엔드 시스템
{Niko Miekka, Tapio Salakoski, Akseli Leino, Filip Ginter, Jenna Kanerva}

초록
본 논문에서는 Raw Text에서 Universal Dependencies로의 다국어 구문 구조 분석을 주제로 한 CoNLL 2018 공동 과제에 투고한 TurkuNLP의 참여 사례를 설명한다. 작년과 달리, 올해의 공동 과제는 구문 트리 외에도 형태소 태깅과 어형 정규화(lemmatization) 정확도를 측정하기 위한 두 가지 새로운 주요 지표를 포함하고 있다. 이러한 새로운 지표들을 기반으로, 특히 어형 정규화를 위한 새로운 최첨단 컴포넌트 개발에 초점을 맞춘 엔드투엔드 구문 분석 파이프라인을 개발하였다. 본 시스템은 26개 팀 중에서 세 가지 주요 지표 중 세 가지에서 가장 높은 종합 순위를 기록하였으며, 어형 정규화를 포함한 지표에서는 1위, 형태소 태깅과 구문 분석 각각에서는 2위를 차지하였다.