18일 전
단일 신경망을 이용한 시퀀스 라벨링을 위한 시퀀스 어라이어먼트 앙상블
{SungRyeol Kim, Hyuk Namgung, Hyein Seo, SangKeun Jung, Jeesu Jung}
초록
시퀀스 레이블링은 주어진 입력 순서상의 각 토큰에 클래스 또는 레이블을 할당하는 기본적인 자연어 처리 과제이다. 최근 이러한 과제에 대응하기 위해 다양한 고급 신경망 아키텍처들이 제안되어 왔다. 반면, 시퀀스 앙상블 문제를 다루기 위한 접근 방식은 여전히 제한적이다. 본 논문에서는 제안된 앙상블 프레임워크 내에서 시퀀스 정렬 방법을 적용함으로써 시퀀스 앙상블 문제를 해결한다. 구체적으로, 단일 신경 시퀀스 레이블링 네트워크로부터 다양한 이질적 시스템을 간편하게 준비할 수 있는 간단하면서도 효율적인 앙상블 후보 생성 프레임워크를 제안한다. 제안된 프레임워크의 성능을 평가하기 위해 품사 태깅(Part-of-Speech, POS) 및 의존성 레이블 예측 문제에 대한 실험을 수행하였다. 그 결과, 제안된 프레임워크는 펜트리뱅크 POS 태깅 데이터셋과 유니버설 의존성 태깅 데이터셋에서 하드 보팅(hard-voting) 방법보다 각각 0.19 및 0.33의 정확도 향상을 달성하였다.