HyperAIHyperAI

Command Palette

Search for a command to run...

Raisonnement semblable à celui des exécutants de programmes

Xinyu Pi Qian Liu Bei Chen Morteza Ziyadi Zeqi Lin Qiang Fu Yan Gao Jian-Guang Lou Weizhu Chen

Résumé

Le raisonnement à partir du langage naturel constitue un objectif depuis longtemps poursuivi par la communauté de recherche. Toutefois, des études ont montré que les modèles linguistiques existants se révèlent insuffisants en matière de raisonnement. Pour remédier à ce problème, nous proposons POET, un nouveau paradigme d'entraînement préalable axé sur le raisonnement. En entraînant les modèles linguistiques à l’aide de programmes et de leurs résultats d’exécution, POET permet aux modèles linguistiques d’acquérir, de manière data-driven, les connaissances de raisonnement détenues par les exécutants de programmes. POET est conceptuellement simple et peut être mis en œuvre à l’aide de divers types d’exécutants de programmes. Dans cet article, nous présentons deux instances simples — POET-Math et POET-Logic — ainsi qu’une instance plus complexe, POET-SQL. Les résultats expérimentaux sur six benchmarks démontrent que POET peut considérablement améliorer les performances des modèles en raisonnement sur le langage naturel, notamment en raisonnement numérique, raisonnement logique et raisonnement à plusieurs sauts. POET ouvre une nouvelle voie pour l’entraînement préalable axé sur l’amélioration du raisonnement, et nous espérons que notre analyse contribuera à orienter les recherches futures sur le raisonnement inspiré des exécutants de programmes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp