BERT de tout, maître de rien

Cet article présente nos résultats obtenus lors de la compétition TRAC 2020, organisée conjointement avec la conférence LREC 2020. Notre équipe portait le nom Ms8qQxMbnjJMgYcw. La compétition comprenait deux sous-tâches menées sur trois langues (bengali, anglais et hindi), dont la tâche des participants était de classifier l’agression dans des textes courts provenant des réseaux sociaux, et de déterminer si celle-ci était de nature genrée ou non. Nous avons utilisé un système unique basé sur BERT, avec deux sorties traitant simultanément toutes les tâches. Notre modèle a obtenu la première place pour la tâche de classification des textes genrés en anglais, et la deuxième place pour celle en bengali, avec des scores F1 respectifs de 0,87 et 0,93.