
摘要
随着网络上仇恨言论的泛滥,迫切需要能够检测此类有害内容的系统。在本文中,我们介绍了在EVALITA 2018自动厌女识别(Automatic Misogyny Identification, AMI)共享任务中开发的机器学习模型。我们生成了三种类型的特征:句子嵌入(Sentence Embeddings)、TF-IDF向量和BOW向量,以表示每条推文。这些特征随后被串联并输入到机器学习模型中。我们的模型在英语子任务A中获得第一名,在英语子任务B中获得第五名。我们发布了获胜模型供公众使用,该模型可在https://github.com/punyajoy/Hateminers-EVALITA 获取。