Hateminers : Détection du discours de haine contre les femmes

Avec la prolifération en ligne des discours de haine, il existe un besoin urgent de systèmes capables de détecter ce contenu nuisible. Dans cet article, nous présentons les modèles d'apprentissage automatique développés pour la tâche partagée d'Identification Automatique du Misogynie (AMI) lors d'EVALITA 2018. Nous générons trois types de caractéristiques : des plongements de phrases (Sentence Embeddings), des vecteurs TF-IDF et des vecteurs BOW pour représenter chaque tweet. Ces caractéristiques sont ensuite concaténées et introduites dans les modèles d'apprentissage automatique. Notre modèle a obtenu la première place pour la sous-tâche A en anglais et la cinquième place pour la sous-tâche B en anglais. Nous mettons notre modèle gagnant à disposition du public, qui est disponible sur https://github.com/punyajoy/Hateminers-EVALITA.