11일 전
JBNU-CCLab, SemEval-2022 Task 12: 수학 기호를 그 설명과 연결하기 위한 Machine Reading Comprehension 및 Span Pair Classification
{Seung-Hoon Na, Sung-Min Lee}

초록
이 논문은 SemEval-2022 Task 12인 ‘수학 기호를 그 설명과 연결하기’에 대한 우리 시스템에 대해 기술하며, 명명된 실체 추출(NER)과 관계 추출(RE)로 구성된 모든 하위 과제에서 리더보드 상위를 달성하였다. 우리 시스템은 SciBERT 기반의 이단계 파이프라인 모델로, 과학 문서 내의 기호, 설명 및 그들 간의 관계를 탐지한다. 시스템은 1) 기계 독해 이해(MRC) 기반의 NER 모델과 2) 스팬 쌍 분류 기반의 RE 모델로 구성된다. 첫 번째 단계에서는 각 실체 유형을 질문 형태로 표현하고, MRC 모델을 이용해 해당 실체 언급 구간을 답변으로 추출한다. 두 번째 단계에서는 두 실체 언급과 그 유형 마커를 스팬 표현으로 인코딩한 후, Softmax 분류기에 입력하여 관계를 분류한다. 또한, 기호 실체의 정확한 경계 탐지를 향상시키기 위해 규칙 기반 기호 토크나이저를 도입하였다. 관계 추출 모델의 성능 향상을 위해 정규화 기법과 앙상블 방법 또한 추가적으로 탐구하였다.