17일 전
유사도 기반 보조 분류기(Named Entity Recognition를 위한)
{Wenge Rong, Zhang Xiong, Yuanxin Ouyang, Jianxin Yang, Shiyuan Xiao}

초록
명사 엔티티 인식(NER) 작업과 관련된 핵심 과제 중 하나인 분할 문제는 엔티티 단어 시퀀스를 탐지할 때 경계 오류를 최소화하려는 목표와 밀접하게 연결되어 있다. 많은 고급 접근 방식이 제안되었지만, 엔티티가 길어질수록 대부분의 기법에서 성능 저하가 발생하는 문제가 존재한다. 이에 따라 이전 연구에서 다중 작업(multi-task) 전략을 활용하여 분할 문제를 해결한 사례를 영감으로 삼아, 본 연구에서는 엔티티 단어와 비엔티티 단어를 구분할 수 있는 유사도 기반 보조 분류기(Similarity-based Auxiliary Classifier, SAC)를 제안한다. 기존의 전통적 분류기와 달리, SAC는 태그를 벡터로 표현하는 방식을 사용함으로써, 단어와 태그 간의 유사도를 계산할 수 있으며, 이를 바탕으로 태그 벡터들의 가중합을 산출할 수 있다. 이 가중합은 NER 작업에 유용한 특징으로 간주될 수 있다. 실험 결과를 통해 SAC 구조의 타당성을 검증하였으며, 기준 모델 대비 SAC 모델이 성능 향상 가능성을 입증하였다.