11일 전

데이터 증강을 활용한 노이즈 있는 자기학습을 통한 공격적 및 혐오 발언 탐지 작업

João A. Leite, Carolina Scarton, Diego F. Silva
데이터 증강을 활용한 노이즈 있는 자기학습을 통한 공격적 및 혐오 발언 탐지 작업
초록

온라인 소셜 미디어는 비방적이며 혐오스러운 댓글로 가득 차 있어, 초당 생성되는 게시물의 규모를 감안할 때 자동 탐지 기술의 필요성이 절실하다. 이 작업을 위한 고품질의 인간 라벨링 데이터셋을 구축하는 것은 어렵고 비용이 많이 드는데, 특히 비혐오적 게시물이 혐오적 게시물보다 훨씬 더 흔하기 때문이다. 그러나 라벨이 없는 데이터는 풍부하며, 확보하기가 쉽고 저렴하다. 이러한 상황에서 약한 라벨링 예시를 활용하여 학습 데이터 양을 늘리는 자기학습(self-training) 기법이 활용될 수 있다. 최근의 '노이즈 있는' 자기학습 접근법은 예측 일관성을 보장하고 노이즈 데이터 및 악성 공격에 대한 강건성을 높이기 위해 데이터 증강 기법을 도입하고 있다. 본 논문에서는 크기가 다른 다섯 가지 사전 훈련된 BERT 아키텍처를 대상으로 세 가지 다른 텍스트 데이터 증강 기법을 사용하여 기본(self-training) 및 노이즈 있는 자기학습을 실험하였다. 두 개의 혐오 발언 및 혐오 발언 데이터셋에서 실험 결과를 평가한 결과, (i) 모델 크기와 관계없이 자기학습이 일관되게 성능을 향상시키며, 두 데이터셋 모두에서 최대 +1.5%의 F1-_macro 점수 향상을 기록했고, (ii) 비록 유사한 설정에서 성공적으로 적용된 바 있으나, 텍스트 데이터 증강 기법을 활용한 노이즈 있는 자기학습은 기본 방법에 비해 혐오 발언 및 혐오 발언 도메인에서 성능이 저하되는 것으로 나타났으며, 백트랜슬레이션과 같은 최첨단 증강 기법을 사용한 경우에도 마찬가지였다.

데이터 증강을 활용한 노이즈 있는 자기학습을 통한 공격적 및 혐오 발언 탐지 작업 | 최신 연구 논문 | HyperAI초신경