Command Palette

Search for a command to run...

4달 전

SIGMORPHON 2022 공동 과제: 형태소 분할 제출 설명서: 단어 수준 형태소 분할을 위한 시퀀스 레이블링

{Leander Girrbach}

SIGMORPHON 2022 공동 과제: 형태소 분할 제출 설명서: 단어 수준 형태소 분할을 위한 시퀀스 레이블링

초록

우리는 단어 수준의 형태소 분할을 위한 시퀀스 레이블링 접근법을 제안한다. 분할 레이블은 수정된 최소 편집 거리 정렬에서 유도된 편집 연산으로 구성된다. 본 연구에서는 시퀀스 레이블링이 '얕은 분할'(shallow segmentation)과 '표준 분할'(canonical segmentation)에 대해 우수한 성능을 보임을 보여주며, 공동 과제에 참여한 모든 언어를 종합한 매크로 평균 F1 스코어에서 96.06을 기록하고 참가 팀 중 3위를 차지하였다. 따라서 우리는 시퀀스 레이블링이 형태소 분할에 있어 매우 유망한 접근법임을 결론지을 수 있다.

벤치마크

벤치마크방법론지표
morpheme-segmentaiton-on-unimorph-4-0BiLSTM for seq labelling (Tü_Seg-1)
macro avg (subtask 1): 96.06
morpheme-segmentaiton-on-unimorph-4-0BiLSTM for seq labelling (Tü_Seg-2)
f1 macro avg (subtask 2): 82.07
lev dist (subtask 2): 4.71

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
SIGMORPHON 2022 공동 과제: 형태소 분할 제출 설명서: 단어 수준 형태소 분할을 위한 시퀀스 레이블링 | 연구 논문 | HyperAI초신경