HyperAIHyperAI
il y a 2 mois

Une référence pour la classification des commentaires toxiques dans le jeu de données Civil Comments

Corentin Duchene; Henri Jamet; Pierre Guillaume; Reda Dehak
Une référence pour la classification des commentaires toxiques dans le jeu de données Civil Comments
Résumé

La détection de commentaires toxiques sur les réseaux sociaux s'est avérée essentielle pour la modération des contenus. Cet article compare un large éventail de modèles différents sur un jeu de données multietiquettes de discours haineux fortement déséquilibré. Nous prenons en compte le temps d'inférence et plusieurs métriques pour mesurer les performances et les biais dans notre comparaison. Nous montrons que toutes les variantes de BERT présentent des performances similaires, indépendamment de la taille, des optimisations ou de la langue utilisée pour pré-entraîner les modèles. Les RNN sont beaucoup plus rapides à l'inférence que n'importe quelle variante de BERT. Le BiLSTM reste un bon compromis entre performance et temps d'inférence. RoBERTa avec une perte focale offre les meilleures performances en termes de biais et d'AUC-ROC (AUROC). Cependant, DistilBERT combine à la fois une bonne AUC-ROC et un temps d'inférence faible. Tous les modèles sont affectés par le biais d'association des identités. BERT, RNN et XLNet sont moins sensibles que le CNN et les transformateurs convolutionnels compacts (Compact Convolutional Transformers).