HyperAIHyperAI

Command Palette

Search for a command to run...

Apprentissage de la Raisonnement dans de Grandes Théories sans Imitation

Kshitij Bansal Christian Szegedy Markus N. Rabe Sarah M. Loos Viktor Toman

Résumé

Dans cet article, nous démontrons comment effectuer la démonstration automatique de théorèmes en présence d'une grande base de connaissances de prémisses potentielles, sans apprendre à partir de preuves humaines. Nous proposons un mécanisme d'exploration qui incorpore des prémisses supplémentaires sélectionnées par une recherche basée sur le tf-idf (term frequency-inverse document frequency). Ce mécanisme est intégré dans un scénario d'apprentissage par renforcement profond. Cela aide à explorer et à apprendre quelles prémisses sont pertinentes pour la démonstration d'un nouveau théorème. Nos expériences montrent que le démonstrateur de théorèmes formé avec ce mécanisme d'exploration surpasse les démonstrateurs formés uniquement sur des preuves humaines. Il approche les performances d'un démonstrateur formé par une combinaison d'apprentissage par imitation et apprentissage par renforcement. Nous menons plusieurs expériences pour comprendre l'importance des hypothèses sous-jacentes qui rendent notre approche d'exploration efficace, expliquant ainsi nos choix de conception.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp