
초록
추측은 텍스트 데이터에서 자연스럽게 발생하는 현상으로, 특히 의생명 정보 검색 분야의 많은 시스템에서 중요한 구성 요소를 형성합니다. 이전 연구에서는 추측 감지의 두 하위 작업인 힌트 감지(cue detection)와 범위 결정(scope resolution)을 규칙 기반 시스템부터 딥러닝 기반 접근 방식까지 다양한 방법으로 다루었습니다. 본 논문에서는 BERT, XLNet, RoBERTa라는 세 가지 인기 있는 트랜스포머 기반 아키텍처를 두 개의 공개 데이터셋인 BioScope 코퍼스와 SFU 리뷰 코퍼스에 적용하여, 이전 결과보다 상당한 개선을 보고합니다(힌트 감지에서 최소 0.29 F1 점수, 범위 결정에서 4.27 F1 점수 개선). 또한 여러 데이터셋에서 모델을 공동 학습시키는 실험을 수행하였으며, 단일 데이터셋 학습 방식보다 큰 마진으로 성능이 우수함을 확인하였습니다. 우리는 XLNet이 다른 벤치마크 데이터셋에서의 결과와 달리 BERT와 RoBERTa보다 일관되게 우수한 성능을 보임을 관찰하였습니다. 이러한 관찰을 확증하기 위해 XLNet과 RoBERTa를 부정 감지 및 범위 결정에 적용하여, BioScope 코퍼스(전체 논문에서 3.16 F1 점수 증가, 초록에서 0.06 F1 점수 증가)와 SFU 리뷰 코퍼스(0.3 F1 점수 증가)의 부정 범위 결정에서 최신 연구 결과(state-of-the-art results)를 보고합니다.