HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 7 أيام

P1: إتقان مسابقات الفيزياء باستخدام التعلم المعزز

P1: إتقان مسابقات الفيزياء باستخدام التعلم المعزز

الملخص

أحرزت النماذج اللغوية الكبيرة (LLMs) تقدماً حديثاً في دفع الحدود من حل الألغاز إلى التفكير العلمي من الدرجة الأولى – النوع الذي يتطلب التصدي للمشكلات التي يجب أن تُقاس صحتها بواقع الطبيعة، وليس مجرد التوافق مع معايير تقييم محددة. وتعتبر الفيزياء أشد اختبار ل هذه التحول، لأنها تربط الرموز بالواقع بطريقة جوهرية، وتعتبر حجر الأساس لمعظم التقنيات الحديثة. في هذا العمل، نُقدّم تقدماً في بحوث الفيزياء من خلال تطوير نماذج لغوية كبيرة تمتلك قدرات استنتاج فيزيائي استثنائية، وبخاصة في حل مسائل الفيزياء على مستوى أولمبياد الفيزياء. نقدّم P1، وهي عائلة من النماذج المفتوحة المصدر للتفكير الفيزيائي، تم تدريبها بالكامل باستخدام التعلم المعزز (RL). ومن بينها، يُعد نموذج P1-235B-A22B أول نموذج مفتوح المصدر يحقق أداءً ذهبياً في الدورة الأخيرة لأولمبياد الفيزياء الدولي (IPhO 2025)، ويحقق 12 ميدالية ذهبية من أصل 13 مسابقة دولية وإقليمية في موسم 2024/2025. كما يتفوق نموذج P1-30B-A3B على معظم النماذج المفتوحة المصدر الأخرى في IPhO 2025، ويحقق ميدالية فضية. وبالإضافة إلى ذلك، عند تزويده بإطار عمل عامل (agentic framework) يُسمى PhysicsMinions، يحقق نموذج P1-235B-A22B+PhysicsMinions التصنيف الأول عالمياً في IPhO 2025، ويحقق أعلى متوسط درجات بين جميع المسابقات الـ13. وبالإضافة إلى الفيزياء، تُظهر نماذج P1 أداءً متميزاً في مهام استنتاج أخرى مثل الرياضيات والبرمجة، مما يدل على القدرة العامة العالية لسلسلة P1.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
P1: إتقان مسابقات الفيزياء باستخدام التعلم المعزز | الأوراق البحثية | HyperAI