16일 전

구문 분석을 위한 효과적인 자기 훈련

{David McClosky, Eugene Charniak, and Mark Johnson}
구문 분석을 위한 효과적인 자기 훈련
초록

우리는 쉽게 구현할 수 있지만 놀랍도록 효과적인, 쉽게 확보할 수 있는 레이블이 없는 데이터를 활용한 이단계 구문 분석기-다시정렬기 시스템의 자기학습 방법을 제안한다. 본 연구에서는 자기학습이 가능함을 보여주며, 이는 자기학습된 구문 분석 결과를 판별형 다시정렬기(discriminative reranker)가 처리할 경우에 가능하다는 점을 밝힌다. 개선된 모델은 월스트리트저널(WSJ) 구문 분석에서 기존 최고 성능보다 절대적으로 1.1% 향상된 F-스코어 92.1%를 달성하였으며, 오류율은 12% 감소하였다. 마지막으로, 이 현상을 보다 깊이 이해하기 위해 분석을 제공한다.