8일 전
TeamUNCC@LT-EDI-EACL2021: Transformers를 활용한 전이학습을 통한 희망적 발언 탐지
{Samira Shaikh, Erfan Al-Hossami, Khyati Mahajan}

초록
이 논문에서는 사전 훈련된 모델을 활용하여 희망 언어(Hope Speech) 탐지 작업에 접근하는 방법을 설명한다. 우리는 EACL2021에서 개최된 LT-EDI-2021의 Task 2: 평등, 다양성 및 포용을 위한 희망 언어 탐지에 참여하였다. 이 작업의 목표는 희망 언어의 존재 여부를 예측하는 동시에, 데이터셋 내에서 동일한 언어에 속하지 않는 샘플의 존재 여부도 함께 판단하는 것이다. 본 연구에서는 영어에 대한 희망 언어 탐지에 RoBERTa 모델을 적응시키는 방법과, 자원이 제한적인 인도계 언어인 타밀어와 말라얄람어에 대해 XLM-RoBERTa 모델을 적응시키는 방법을 제시한다. 제안한 방법을 사용하여 텍스트를 '희망 언어', '비희망 언어', '언어 외'로 분류하는 성능을 평가하였으며, 영어에서 F1 점수 0.93으로 1위, 타밀어에서 F1 점수 0.61로 1위, 말라얄람어에서 F1 점수 0.83으로 3위를 기록하였다.