HyperAIHyperAI

Command Palette

Search for a command to run...

StepGame : Un Nouveau Benchmark pour le Raisonnement Spatial Multi-Étapes Résilient dans les Textes

Zhengxiang Shi Qiang Zhang Aldo Lipani

Résumé

L’inférence des relations spatiales dans le langage naturel constitue une capacité essentielle qu’un système intelligent devrait posséder. Le jeu de données bAbI vise à capturer des tâches pertinentes dans ce domaine (tâches 17 et 19). Toutefois, ces tâches présentent plusieurs limitations : elles sont principalement restreintes à des expressions fixes, elles exigent un nombre limité d’étapes de raisonnement pour être résolues, et elles ne testent pas efficacement la robustesse des modèles face à des entrées contenant des informations irrelevantes ou redondantes. Dans cet article, nous présentons un nouveau jeu de données de type Q&R (Question-Réponse), appelé StepGame, conçu pour évaluer la raisonnement spatial multi-étapes robuste dans les textes. Nos expériences montrent que les modèles d’état de l’art sur le jeu de données bAbI éprouvent des difficultés majeures sur StepGame. Par ailleurs, nous proposons un réseau de neurones à mémoire augmentée basé sur le produit tensoriel (TP-MANN), spécifiquement conçu pour les tâches de raisonnement spatial. Les résultats expérimentaux sur les deux jeux de données démontrent que notre modèle surpasse tous les modèles de référence en termes de généralisation et de robustesse.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
StepGame : Un Nouveau Benchmark pour le Raisonnement Spatial Multi-Étapes Résilient dans les Textes | Articles | HyperAI