Apprentissage du classement de paires question-réponse à l'aide d'un encodeur récurrent hiérarchique avec regroupement de sujets latents

Dans cet article, nous proposons une nouvelle architecture neuronale de bout en bout pour le classement des réponses candidates, qui adapte un réseau neuronal récurrent hiérarchique et un module de regroupement de sujets latents. Avec notre modèle proposé, un texte est encodé en une représentation vectorielle à partir du niveau mot jusqu'au niveau segment pour capturer efficacement l'ensemble du sens. En particulier, grâce à la structure hiérarchique, notre modèle montre des dégradations de performance très faibles dans la compréhension de textes plus longs, alors que d'autres modèles de réseaux neuronaux récurrents de pointe en souffrent. De plus, le module de regroupement de sujets latents extrait des informations sémantiques des échantillons cibles. Ce module de regroupement est utile pour toute tâche liée au texte en permettant à chaque échantillon de données de trouver son cluster de sujet le plus proche, ce qui aide ainsi le modèle neuronal à analyser l'ensemble des données. Nous évaluons nos modèles sur le corpus Ubuntu Dialogue et sur un ensemble de données de questions-réponses dans le domaine des produits électroniques grand public, en relation avec les produits Samsung. Le modèle proposé obtient des résultats d'état de l'art pour le classement des paires question-réponse.