HyperAIHyperAI
il y a 2 mois

Réseaux Relationnels Récurrents

Rasmus Berg Palm; Ulrich Paquet; Ole Winther
Réseaux Relationnels Récurrents
Résumé

Ce travail porte sur l'apprentissage de tâches nécessitant une chaîne d'étapes interdépendantes de raisonnement relationnel, comme répondre à des questions complexes sur les relations entre objets ou résoudre des casse-têtes où les éléments plus petits d'une solution s'interconnectent mutuellement. Nous présentons le réseau relationnel récurrent, un module polyvalent qui opère sur une représentation graphique d'objets. En tant que généralisation du réseau relationnel de Santoro et al. [2017], il peut améliorer tout modèle de réseau neuronal en lui conférant la capacité de réaliser des raisonnements relationnels en plusieurs étapes. Avec le réseau relationnel récurrent, nous obtenons des résultats d'avant-garde sur l'ensemble de données bAbI pour la réponse à des questions textuelles, en résolvant constamment 20/20 tâches. Comme bAbI n'est pas particulièrement difficile du point de vue du raisonnement relationnel, nous introduisons Pretty-CLEVR, un nouveau jeu de données diagnostique pour le raisonnement relationnel. Dans le cadre de Pretty-CLEVR, nous pouvons varier les questions afin de contrôler le nombre d'étapes de raisonnement relationnel nécessaires pour obtenir la réponse. À l'aide de Pretty-CLEVR, nous explorons les limites des perceptrons multicouches, des réseaux relationnels et des réseaux relationnels récurrents. Enfin, nous montrons comment les réseaux relationnels récurrents peuvent apprendre à résoudre des puzzles Sudoku à partir de données d'entraînement supervisées, une tâche exigeante nécessitant jusqu'à 64 étapes de raisonnement relationnel. Nous obtenons parmi les méthodes comparables des résultats d'avant-garde en résolvant 96,6 % des puzzles Sudoku les plus difficiles.

Réseaux Relationnels Récurrents | Articles de recherche | HyperAI