2달 전
Hateminers: 여성에 대한 증오 발언 감지
Punyajoy Saha; Binny Mathew; Pawan Goyal; Animesh Mukherjee

초록
온라인상에서 혐오 발언이 급증함에 따라 이러한 유해한 콘텐츠를 감지할 수 있는 시스템의 필요성이 절실해지고 있습니다. 본 논문에서는 EVALITA 2018에서 공유된 Automatic Misogyny Identification (AMI) 작업을 위해 개발된 머신 러닝 모델을 소개합니다. 우리는 각 트윗을 표현하기 위해 세 가지 유형의 특징을 생성하였습니다: 문장 임베딩(Sentence Embeddings), TF-IDF 벡터(TF-IDF Vectors), 그리고 BOW 벡터(BOW Vectors). 이러한 특징들은 연결(concatenated)되어 머신 러닝 모델에 입력됩니다. 우리의 모델은 영어 서브태스크 A에서 1위를 차지하였으며, 영어 서브태스크 B에서는 5위를 기록하였습니다. 우리는 우승 모델을 공개적으로 사용할 수 있도록 배포하며, 해당 모델은 https://github.com/punyajoy/Hateminers-EVALITA에서 이용 가능합니다.