Intern-S1: نموذج أساسي متعدد الوسائط علمي

في السنوات الأخيرة، ظهرت كمّ هائل من النماذج الأساسية المفتوحة المصدر، وأحرزت تقدماً ملحوظاً في بعض المجالات الشائعة والمحفزة، حيث بلغت أداؤها مستوى قريب من نماذج المصدر المغلق. ومع ذلك، في المجالات العلمية المتخصصة ذات القيمة العالية ولكنها أكثر تحدياً، إما أن هذه المجالات ما زالت تعتمد على نماذج خبراء، أو أن تقدم النماذج الأساسية العامة يتأخر بشكل كبير مقارنةً بالمناطق الشائعة، ما يُعدّ غير كافٍ لتحويل البحث العلمي، ويترك فجوة كبيرة بين النماذج المفتوحة المصدر والنموذج المغلقة المصدر في هذه المجالات العلمية. ولتقليل هذه الفجوة واستكشاف خطوة إضافية نحو الذكاء الاصطناعي العام (AGI)، نقدّم نموذج Intern-S1، وهو نموذج عام متخصص يتمتع بقدرات عامة في الفهم والاستنتاج، ويتميز بخبرة متخصصة في تحليل البيانات متعددة الأشكال في المجالات العلمية. يُعدّ Intern-S1 نموذجًا متعدد الوسائط من نوع "مزيج الخبراء" (Mixture-of-Experts - MoE)، يحتوي على 28 مليار معلمة مفعّلة و241 مليار معلمة إجمالية، وقد تم تدريبه بشكل مستمر على 5 تيرابايت من الرموز (tokens)، منها أكثر من 2.5 تيرابايت من مصادر علمية. وفي مرحلة ما بعد التدريب، يمرّ Intern-S1 بتدريب مُعزّز خارج الشبكة (offline) ثم تدريب مُعزّز عبر الشبكة (online) ضمن منصة InternBootCamp، حيث نقترح نموذج "مزيج المكافآت" (Mixture-of-Rewards - MoR) لدمج تدريب التعلم المُعزّز على أكثر من 1000 مهمة في آنٍ واحد. وبفضل الابتكارات المتكاملة في الخوارزميات، وبيانات التدريب، وأنظمة التدريب، حقق Intern-S1 أداءً من الطراز الرفيع في تدريب التعلم المُعزّز عبر الشبكة. وفي معايير التقييم الشاملة، أظهر Intern-S1 أداءً تنافسياً في المهام العامة للاستنتاج بين النماذج المفتوحة المصدر، كما تفوق بشكل كبير على النماذج المفتوحة المصدر في المجالات العلمية، متفوقاً على النماذج المغلقة المصدر الرائدة في المهام المتخصصة، مثل تخطيط تصنيع الجزيئات، وتوقع ظروف التفاعل، وتقدير الاستقرار الديناميكي الحراري للمواد البلورية. يمكن الوصول إلى نماذجنا عبر الرابط التالي: https://huggingface.co/internlm/Intern-S1.