Command Palette
Search for a command to run...

الملخص
نقدم نموذجًا أساسيًا للتفكير العلمي يُتماشى بين اللغة الطبيعية والتمثيلات العلمية المتنوعة. تم تدريب النموذج مسبقًا على مجموعة بيانات تتكون من 206 مليار رمز، تشمل نصوصًا علمية، وسلاسل نقية، و أزواج من السلاسل والنصوص، ثم تم تحسينه عبر التدريب الموجه (SFT) على 40 مليون إرشاد، مع تطبيق تقنية التدريب التدريجي البارد (annealed cold-start bootstrapping) لاستثارة سلسلة التفكير الطويلة الشكل، بالإضافة إلى التعلم المعزز مع تشكيل مكافأة مخصصة للمهام، مما يُثبّت التفكير العلمي المُتعمّد. ويُقدّم النموذج أربع عائلات من المهارات، تغطي ما يصل إلى 103 مهمة ضمن سير العمل العلمي: (أ) الترجمة الدقيقة بين النصوص والصيغ العلمية، (ب) استخراج النص أو المعرفة، (ج) توقع الخصائص، (د) تصنيف الخصائص، (هـ) توليد وتصميم سلاسل غير مشروطة ومشروطة. مقارنةً بالنماذج المتخصصة، فإن نهجنا يوسع نطاق التغطية الإرشادية، ويُحسّن التعميم عبر المجالات المختلفة، ويُعزز الدقة. ونُفصّل في إجراءات جمع البيانات وعملية التدريب، ونُظهر أن التعلم عبر التخصصات يُقوّي القدرة على التحويل ويثبّت موثوقية الأداء في المهام اللاحقة. تم إتاحة النموذج، وبيانات التدريب الموجهة، ورمز التقييم مفتوح المصدر عبر الرابطين: https://huggingface.co/SciReason و https://github.com/open-sciencelab/SciReason.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.