HyperAIHyperAI

Command Palette

Search for a command to run...

MACM : Utilisation d’un système multi-agents pour l’extraction de conditions dans la résolution de problèmes mathématiques complexes

Bin Lei Yi Zhang Shan Zuo Ali Payani Caiwen Ding

Résumé

Les avancées récentes des grands modèles linguistiques, tels que GPT-4, ont démontré des capacités remarquables dans le traitement des requêtes standards. Malgré ces progrès, leur performance diminue considérablement face aux problèmes mathématiques avancés nécessitant une raisonnement logique complexe et multi-étapes. Afin d’améliorer leurs capacités d’inférence, la recherche actuelle s’intéresse au développement de prompting engineering, illustré par des méthodologies telles que le Tree of Thought et le Graph of Thought. Toutefois, ces approches existantes rencontrent deux limitations majeures. Premièrement, leur efficacité dans la résolution de problèmes mathématiques complexes reste limitée. Deuxièmement, la nécessité de concevoir des prompts distincts pour chaque problème nuit à leur généralisation. Face à ces contraintes, ce papier introduit une nouvelle méthode de prompting nommée Système Multi-Agents pour le Mining Conditionnel (MACM). Cette approche non seulement permet de résoudre efficacement des problèmes mathématiques complexes, mais démontre également une forte capacité de généralisation dans divers contextes mathématiques. Grâce à MACM, la précision de GPT-4 Turbo sur les problèmes les plus difficiles du niveau 5 du jeu de données MATH passe de 54,68 % à 76,73 %. Le code source est disponible à l’adresse suivante : \url{https://github.com/bin123apple/MACM}.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp