الملخص

نُقدِّم نموذج اللغة المفتوح المصدر DeepSeek-Prover-V1.5، المُصمم لبرهان النظريات في بيئة Lean 4، والذي يُحسِّن نموذج DeepSeek-Prover-V1 من خلال تحسين عمليتي التدريب والاستدلال. تم تدريب النموذج مبدئيًا على DeepSeekMath-Base، مع تخصُّص في اللغات الرياضية الرسمية، ثم تمت عملية التدريب المُراقبة الدقيقة باستخدام مجموعة بيانات مُحسَّنة لبرهان النظريات الرسمية المستمدة من DeepSeek-Prover-V1. وتم تحقيق تحسين إضافي من خلال التعلُّم التكراري من خلال تغذية راجعة مُقدَّمة من مساعدات البرهان (RLPAF). وبالإضافة إلى النهج القائم على إنتاج البرهان ككل في عملية واحدة المُتَّبَع في DeepSeek-Prover-V1، نُقدِّم RMaxTS، وهي نسخة مُعدَّلة من خوارزمية بحث شجرة مونت كارلو، تُستخدم فيها استراتيجية استكشاف مُشَوَّقة بعوائد داخلية لِتوليد مسارات برهان متنوعة. وقد أظهر DeepSeek-Prover-V1.5 تحسينات كبيرة مقارنةً بـ DeepSeek-Prover-V1، محقِّقًا نتائجًا جديدة على مستوى الحالة الراهنة (SOTA) على مجموعة اختبار معيار miniF2F بمستوى المدرسة الثانوية (63.5%) وعلى معيار ProofNet بمستوى الجامعة (25.3%).

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Command Palette

DeepSeek-Prover-V1.5: استغلال ملاحظات مساعد الإثبات في التعلم المعزز وبحث شجرة مونت كارلو

Huajian Xin Z. Z. Ren Junxiao Song Zhihong Shao Wanjia Zhao Haocheng Wang Bo Liu Liyue Zhang Xuan Lu Qiushi Du7 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

DeepSeek-Prover-V1.5: استغلال ملاحظات مساعد الإثبات في التعلم المعزز وبحث شجرة مونت كارلو

Huajian Xin Z. Z. Ren Junxiao Song Zhihong Shao Wanjia Zhao Haocheng Wang Bo Liu Liyue Zhang Xuan Lu Qiushi Du7 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

DeepSeek-Prover-V1.5: استغلال ملاحظات مساعد الإثبات في التعلم المعزز وبحث شجرة مونت كارلو

Huajian Xin Z. Z. Ren Junxiao Song Zhihong Shao Wanjia Zhao Haocheng Wang Bo Liu Liyue Zhang Xuan Lu Qiushi Du7 more

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Huajian Xin Z. Z. Ren Junxiao Song Zhihong Shao Wanjia Zhao Haocheng Wang Bo Liu Liyue Zhang Xuan Lu Qiushi Du

Huajian Xin Z. Z. Ren Junxiao Song Zhihong Shao Wanjia Zhao Haocheng Wang Bo Liu Liyue Zhang Xuan Lu Qiushi Du

Huajian Xin Z. Z. Ren Junxiao Song Zhihong Shao Wanjia Zhao Haocheng Wang Bo Liu Liyue Zhang Xuan Lu Qiushi Du