الملخص

لقد حققت النماذج اللغوية الكبيرة تقدماً ملحوظاً في إنتاج الأدلة الرياضية الدقيقة مؤخراً. في المقابل، يظل استخدام النماذج اللغوية الكبيرة في إثبات النظريات بلغات رسمية (مثل Lean) تحدياً كبيراً ومرتّباً من حيث التكلفة الحسابية، خصوصاً عند التعامل مع المسائل على مستوى البكالوريوس وما يتجاوزه. في هذا العمل، نقدّم Seed-Prover 1.5، نموذجاً لإثبات النظريات الرسمية تم تدريبه عبر تعلم التقييم الوكيل على نطاق واسع، إلى جانب تدفق عمل فعّال يُسمى التوسع في وقت الاختبار (TTS). من خلال التفاعلات الواسعة مع Lean وأدوات أخرى، يُكثّف النموذج خبرته أثناء عملية التعلم عبر التقييم (RL)، مما يُحسّن بشكل كبير القدرة والكفاءة في إثبات النظريات الرسمية. علاوةً على ذلك، وباستغلال التطورات الحديثة في إثباتات اللغة الطبيعية، يُمكّن تدفق العمل TTS من تقليل الفجوة بين اللغة الطبيعية واللغة الرسمية بشكل فعّال. مقارنةً بالأساليب المتطورة حديثاً، يُحقّق Seed-Prover 1.5 أداءً متفوّقاً بحاجة أقل إلى موارد الحوسبة. إذ نجح في حل 88% من مسائل PutnamBench (على مستوى البكالوريوس)، و80% من مسائل Fate-H (على مستوى الدراسات العليا)، و33% من مسائل Fate-X (على مستوى الدكتوراه). وبشكل ملحوظ، استطعنا، باستخدام نظامنا، حل 11 من أصل 12 مسألة من مسائل Putnam 2025 خلال 9 ساعات فقط. تشير نتائجنا إلى أن التوسع في التعلّم من الخبرة، المُحرّك بتعليقات رسمية عالية الجودة، يمتلك إمكانات هائلة لمستقبل التفكير الرياضي الرمزي.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

Seed-Prover 1.5: إتقان إثبات النظريات على مستوى البكالوريوس من خلال التعلم من الخبرة

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi12 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

Seed-Prover 1.5: إتقان إثبات النظريات على مستوى البكالوريوس من خلال التعلم من الخبرة

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi12 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

Seed-Prover 1.5: إتقان إثبات النظريات على مستوى البكالوريوس من خلال التعلم من الخبرة

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi12 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi

Jiangjie Chen Wenxiang Chen Jiacheng Du Jinyi Hu Zhicheng Jiang Allan Jie Xiaoran Jin Xing Jin Chenggang Li Wenlei Shi