12일 전
생물의학 분야 NER: 새로운 스키마와 원거리 지도 학습을 활용한 방법
{Kamalakar Karlapalem, Veera Raghavendra Chikka, Alok Kar, Anshita Khandelwal}

초록
생물의학명칭인식(Biomedical Named Entity Recognition, BMNER)은 생물의학 텍스트 마이닝 분야에서 가장 중요한 과제 중 하나이다. 기존의 대부분의 연구는 실제 생물의학 데이터셋에서 상당 부분을 차지하는 비연속적이고 겹치는 엔티티의 식별에 주목하지 않았다. 본 논문에서는 복잡한 엔티티를 효과적으로 포착하기 위한 새로운 어노테이션 체계를 제안하고, 원거리 감독(distant supervision)이 딥러닝 시퀀스 레이블링 모델에 미치는 영향을 탐구한다. BMNER 작업에서 제안하는 어노테이션 체계는 동일한 모델 기반으로 기존의 BIO 기반 어노테이션 체계보다 우수한 성능을 보였다. 또한, 임베딩의 미세조정(fine-tuning) 없이도 여러 코퍼스에서 최신 기술(state-of-the-art) 모델보다 높은 F1 점수를 달성함으로써, 본 모델을 통한 신경망 특성 추출의 효율성을 입증하였다.