il y a 2 mois

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi

Résumé

Les grands modèles linguistiques ont récemment fait des progrès significatifs dans la génération de preuves mathématiques rigoureuses. En revanche, leur utilisation pour la démonstration de théorèmes dans des langages formels (tels que Lean) reste difficile et coûteuse en ressources computationnelles, en particulier pour des problèmes au niveau du baccalauréat et au-delà. Dans ce travail, nous présentons Seed-Prover 1.5, un modèle de démonstration théorème formel entraîné par apprentissage par renforcement agencé à grande échelle, accompagné d’un flux de travail d’échelle au moment du test (test-time scaling, TTS) efficace. Grâce à des interactions étendues avec Lean et d’autres outils, le modèle accumule continuellement de l’expérience durant le processus d’apprentissage par renforcement, ce qui améliore considérablement sa capacité et son efficacité en matière de démonstration formelle. Par ailleurs, en tirant parti des avancées récentes dans les preuves en langage naturel, notre workflow TTS permet de combler efficacement le fossé entre les langages naturels et les langages formels. Par rapport aux méthodes de pointe, Seed-Prover 1.5 atteint des performances supérieures avec un budget informatique réduit. Il résout 88 % des problèmes de PutnamBench (niveau licence), 80 % de Fate-H (niveau master) et 33 % de Fate-X (niveau doctorat). Notamment, en utilisant notre système, nous avons résolu 11 des 12 problèmes du Putnam 2025 en moins de 9 heures. Nos résultats suggèrent que l’augmentation de l’apprentissage à partir de l’expérience, alimentée par un retour formel de haute qualité, recèle un potentiel considérable pour l’avenir du raisonnement mathématique formel.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 2 mois

Traitement Du Langage Naturel

Tâche

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

il y a 2 mois

Traitement Du Langage Naturel

Tâche

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Seed-Prover 1.5 : Maîtrise de la démonstration de théorèmes au niveau licence grâce à l'apprentissage par l'expérience

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi12 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Seed-Prover 1.5 : Maîtrise de la démonstration de théorèmes au niveau licence grâce à l'apprentissage par l'expérience

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi12 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Seed-Prover 1.5 : Maîtrise de la démonstration de théorèmes au niveau licence grâce à l'apprentissage par l'expérience

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi12 more

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi