HyperAIHyperAI

Command Palette

Search for a command to run...

SciReasoner: وضع الأساس للتفكير العلمي عبر التخصصات

الملخص

نقدم نموذجًا أساسيًا للتفكير العلمي يُتماشى بين اللغة الطبيعية والتمثيلات العلمية المتنوعة. تم تدريب النموذج مسبقًا على مجموعة بيانات تتكون من 206 مليار رمز، تشمل نصوصًا علمية، وسلاسل نقية، و أزواج من السلاسل والنصوص، ثم تم تحسينه عبر التدريب الموجه (SFT) على 40 مليون إرشاد، مع تطبيق تقنية التدريب التدريجي البارد (annealed cold-start bootstrapping) لاستثارة سلسلة التفكير الطويلة الشكل، بالإضافة إلى التعلم المعزز مع تشكيل مكافأة مخصصة للمهام، مما يُثبّت التفكير العلمي المُتعمّد. ويُقدّم النموذج أربع عائلات من المهارات، تغطي ما يصل إلى 103 مهمة ضمن سير العمل العلمي: (أ) الترجمة الدقيقة بين النصوص والصيغ العلمية، (ب) استخراج النص أو المعرفة، (ج) توقع الخصائص، (د) تصنيف الخصائص، (هـ) توليد وتصميم سلاسل غير مشروطة ومشروطة. مقارنةً بالنماذج المتخصصة، فإن نهجنا يوسع نطاق التغطية الإرشادية، ويُحسّن التعميم عبر المجالات المختلفة، ويُعزز الدقة. ونُفصّل في إجراءات جمع البيانات وعملية التدريب، ونُظهر أن التعلم عبر التخصصات يُقوّي القدرة على التحويل ويثبّت موثوقية الأداء في المهام اللاحقة. تم إتاحة النموذج، وبيانات التدريب الموجهة، ورمز التقييم مفتوح المصدر عبر الرابطين: https://huggingface.co/SciReason و https://github.com/open-sciencelab/SciReason.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp