Réseau de Comparaison d'Options pour la Compréhension de Textes à Choix Multiple

La compréhension de lecture à choix multiples (MCRC) est la tâche consistant à sélectionner la réponse correcte parmi plusieurs options, en se basant sur une question et un article. Les modèles MCRC existants comparent généralement chaque option de manière indépendante ou calculent une représentation de longueur fixe pour chaque option avant de les comparer. Cependant, les humains comparent habituellement les options à différents niveaux de granularité avant de lire l'article en détail, afin d'optimiser leur raisonnement. En imitant ce processus humain, nous proposons un réseau de comparaison d'options (OCN) pour la MCRC, qui compare les options au niveau des mots afin d'identifier leurs corrélations plus efficacement et d'aider au raisonnement. Plus précisément, chaque option est encodée en une séquence de vecteurs à l'aide d'un "skimmer" pour conserver autant que possible les informations fines. Un mécanisme d'attention est utilisé pour comparer ces séquences vecteur par vecteur, permettant ainsi d'identifier des corrélations plus subtiles entre les options, potentiellement précieuses pour le raisonnement. Les résultats expérimentaux sur le jeu de données MCRC RACE, issu des examens anglais humains, montrent que notre modèle dépasse significativement les méthodes existantes. De plus, il s'agit du premier modèle à surpasser les performances des travailleurs du Amazon Mechanical Turk sur l'ensemble du jeu de données.