7 个月前

摘要

随着网络上仇恨言论的泛滥，迫切需要能够检测此类有害内容的系统。在本文中，我们介绍了在EVALITA 2018自动厌女识别（Automatic Misogyny Identification, AMI）共享任务中开发的机器学习模型。我们生成了三种类型的特征：句子嵌入（Sentence Embeddings）、TF-IDF向量和BOW向量，以表示每条推文。这些特征随后被串联并输入到机器学习模型中。我们的模型在英语子任务A中获得第一名，在英语子任务B中获得第五名。我们发布了获胜模型供公众使用，该模型可在https://github.com/punyajoy/Hateminers-EVALITA 获取。

源 PDF