Tâche partagée sur les pronoms ambigus de genre : Renforcement de la confiance du modèle par agrégation de preuves

Ce papier présente un ensemble solide de résultats pour la résolution des pronominaux ambigus de genre dans le cadre de la tâche partagée Gendered Ambiguous Pronouns. Le modèle proposé s'appuie sur les forces des modèles d'état de l'art en langage naturel et en résolution de coreférance, tout en introduisant une nouvelle architecture profonde fondée sur des preuves. L'intégration de preuves issues des modèles de coreférance complète l'architecture de base, et une analyse montre que le modèle n'est pas affecté par leurs faiblesses, notamment le biais de genre. La modularité et la simplicité de l'architecture rendent son extension aisée pour des améliorations ultérieures, tout en la rendant applicable à d'autres problèmes de traitement du langage naturel. L'évaluation sur les données de test GAP atteint une performance de pointe avec un score F1 de 92,5 % (biais de genre de 0,97), s'approchant ainsi de la performance humaine de 96,6 %. La solution end-to-end présentée ici a terminé en première position au concours Kaggle, avec une avance significative.