
초록
공명 해결(coreference resolution)는 텍스트 요약이나 질의응답과 같은 고수준 정보 검색 작업을 지원하기 위해 자동 텍스트 이해에 필수적인 요소이다. 기존 연구에 따르면, 최신 기술(예: BERT 기반)의 성능은 과학 논문에 적용될 경우 명백히 저하된다. 본 논문에서는 연구 논문 내에서의 공명 해결 작업과 이후 지식 그래프(KG) 구축을 탐구한다. 다음과 같은 기여를 제시한다: (1) 과학, 기술, 의학(STM) 분야의 10개 서로 다른 학문 분야에서 구성된 공명 해결을 위한 어노테이션 코퍼스를 구축하였다; (2) 연구 논문에서의 자동 공명 해결을 위한 전이 학습(transfer learning) 기법을 제안하였다; (3) 공명 해결이 지식 그래프 구축에 미치는 영향을 분석하였다; (4) 10개 STM 분야의 55,485편의 논문에서 자동으로 구축된 연구용 지식 그래프를 공개하였다. 포괄적인 실험을 통해 제안된 접근 방식의 유용성을 입증하였다. 제안한 전이 학습 방법은 본 연구에서 제시한 코퍼스에서 최신 기준 대비 F1 점수 61.4(+11.0)로 상당히 우수한 성능을 보였으며, 골드 표준 지식 그래프를 기준으로 한 평가에서는 공명 해결이 구축된 지식 그래프의 품질을 크게 향상시켜 F1 점수 63.5(+21.8)를 기록하였다.