12일 전

SIGMORPHON 2022 공동 과제: 형태소 분할 제출 설명서: 단어 수준 형태소 분할을 위한 시퀀스 레이블링

{Leander Girrbach}
SIGMORPHON 2022 공동 과제: 형태소 분할 제출 설명서: 단어 수준 형태소 분할을 위한 시퀀스 레이블링
초록

우리는 단어 수준의 형태소 분할을 위한 시퀀스 레이블링 접근법을 제안한다. 분할 레이블은 수정된 최소 편집 거리 정렬에서 유도된 편집 연산으로 구성된다. 본 연구에서는 시퀀스 레이블링이 '얕은 분할'(shallow segmentation)과 '표준 분할'(canonical segmentation)에 대해 우수한 성능을 보임을 보여주며, 공동 과제에 참여한 모든 언어를 종합한 매크로 평균 F1 스코어에서 96.06을 기록하고 참가 팀 중 3위를 차지하였다. 따라서 우리는 시퀀스 레이블링이 형태소 분할에 있어 매우 유망한 접근법임을 결론지을 수 있다.

SIGMORPHON 2022 공동 과제: 형태소 분할 제출 설명서: 단어 수준 형태소 분할을 위한 시퀀스 레이블링 | 최신 연구 논문 | HyperAI초신경