HyperAIHyperAI

Command Palette

Search for a command to run...

MiniF2F : une base de benchmark inter-systèmes pour les mathématiques de niveau olympiade formelle

Kunhao Zheng Jesse Michael Han Stanislas Polu

Résumé

Nous présentons miniF2F, un jeu de données comprenant des énoncés de problèmes mathématiques de niveau olympiade formel, conçu pour offrir une référence unifiée et trans-systèmes pour l'évaluation des preuves automatiques par réseaux neuronaux. Le benchmark miniF2F cible actuellement Metamath, Lean, Isabelle (partiellement) et HOL Light (partiellement), et se compose de 488 énoncés extraits des concours AIME, AMC et de la Olympiade internationale de mathématiques (IMO), ainsi que de contenus issus de cours de mathématiques au lycée et en licence. Nous rapportons des résultats de base obtenus avec GPT-f, un prouveur théorème neuronal fondé sur GPT-3, accompagnés d'une analyse de ses performances. Nous espérons que miniF2F deviendra un effort collaboratif de la communauté et que ce benchmark contribuera à stimuler les progrès dans le domaine de la preuve théorème neuronale.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp