HyperAI
Back to Headlines

مختبر الذكاء الاصطناعي في شنغهاي يطلق نموذج «شون شن» العلمي متعدد النماذج Intern-S1 ويُ开放ه للجميع

منذ 6 أيام

في 26 يوليو، افتُتحت مؤتمر العالم الاصطناعي 2025 (WAIC 2025)، حيث أطلقت مختبر الذكاء الاصطناعي في شنغهاي نموذجًا متعدد الأوضاع في العلوم يُدعى "Intern-S1" وتم إتاحة استخدامه مفتوح المصدر. ويعتبر هذا النموذج أول نموذج عام يدمج قدرات عميقة في العلوم، ويتميز بموازنة عالية بين الأداء اللغوي والمتعدد الأوضاع. كما يحتوي على معرفة متعددة التخصصات، ويركز على تحسين القدرة العلمية، مما يجعله نموذجًا عامًا مفتوح المصدر يتمتع بأفضل الأداء في مجال النماذج متعددة الأوضاع. تم أيضًا إطلاق منصة "Intern-Discovery" التي تعتمد على Intern-S1، والتي تهدف إلى تحسين قدرات الباحثين، وال أدوات البحث، وال موضوعات البحث، عبر تحسينها بشكل متكامل، مما يساعد على تقدم البحث العلمي من أسلوب الاستكشاف الفردي إلى مرحلة "Law of Scaling" في العلم. يمكن للباحثين تجربة Intern-S1 عبر موقع تجريبي، كما تم توفير روابط لمواقع GitHub وHuggingFace وModelScope. مع تطور النماذج الكبيرة في مجالات مثل المحادثة والرسم والكتابة البرمجية، ما زال العلم ينتظر نموذجًا يفهم العلوم بشكل عميق. تواجه النماذج الحالية صعوبات في فهم البيانات العلمية المعقدة، مما يجعلها غير كافية لمهام البحث التي تتطلب دقة واحترافية عالية. كما أن النماذج المغلقة تواجه مشاكل في التكاليف العالية وقلة الشفافية. لذا، قدم Intern-S1 "محرك تحليل علوم متعدد الأوضاع"، يمكنه تفسير بيانات كيميائية وبنية بروتينات و tín hiệuات زلزالية وغيرها بدقة، ويتمتع بقدرات متقدمة مثل توقع مسارات تكوين المركبات الكيميائية، وتحديد مصداقية التفاعلات الكيميائية، وتحديد أحداث الاهتزازات الزلزالية، مما يحوله من "مساعد محادثة" إلى "شريك بحثي". بفضل قدراته المميزة، تفوق Intern-S1 على النماذج المغلقة مثل Grok-4 في مهام علمية متخصصة، كما يتفوق على النماذج المفتوحة مثل InternVL3 وQwen2.5-VL. كما تم تطوير نظام "OriGene" المُسمى "الدكتور المرضي الافتراضي"، بالتعاون مع مختبر لينغتشوان وجامعة شنغهاي للتكنولوجيا وجامعة فو دان وMIT، والذي ساهم في اكتشاف أهداف جديدة لعلاج سرطان الكبد والقولون، وتم التحقق من هذه الأهداف عبر عينات سريرية وتجارب على الحيوانات. لتعزيز قدرات Intern-S1، تم تطوير مكونات مبتكرة في البنية، مثل "Tokenizer ديناميكي" و"مُشفر ل tínالات زمنية"، مما يسمح بدمج بيانات علمية متعددة مثل الصيغ الكيميائية والبيانات الجيولوجية والبيانات الفلكية والبيانات الطبية. كما تمت تحسين كفاءة المعالجة، حيث بلغت نسبة الضغط على الصيغ الكيميائية 70% أكثر من DeepSeek-R1، مع تحسين الأداء في مهام متخصصة. أيضًا، قدم الفريق منهجية "دمج العلوم والمهارة" لتطوير البيانات، حيث تم استخدام كميات هائلة من البيانات العلمية العامة لتوسيع معرفة النموذج، مع إنتاج بيانات متخصصة عبر نماذج متعددة، وتم التحقق من جودة هذه البيانات عبر نماذج متخصصة. هذا النهج يدعم النموذج الأساسي بشكل مستمر، مما يمنحه قدرات عامة ومهارة متخصصة. من ناحية أخرى، تم تحسين عمليات التدريب عبر تطوير أنظمة وتقنيات متكاملة. بفضل تحسينات في النظام والخوارزميات، تم تقليل تكاليف التدريب بالاعتماد على دقة FP8 بنسبة 10 أضعاف. كما تم تطوير خوارزمية "مزيج المكافآت" (Mixture of Rewards) لتحسين تدريب النموذج، مما يحقق كفاءة وثباتًا عاليين. منذ إطلاق مختبر شنغهاي لذكاء الاصطناعي، تم تطوير نموذج "ShuSheng" (InternLM) و"InternVL" و"InternThinker"، وتم دمج هذه النماذج في Intern-S1. كما تم إتاحة أدوات متعددة مثل XTuner وLMDeploy وOpenCompass وMinerU وMindSearch، مما ساهم في بناء مجتمع مفتوح المصدر نشط يضم ملايين المطورين. في المستقبل، ستعمل مختبر شنغهاي على إتاحة Intern-S1 و أدواته بشكل مفتوح، مع دعم الاستخدام التجاري مجانًا، وتقديم خدمات عبر الإنترنت. كما أظهر Intern-S1 قدراته في تطبيقات الحياة اليومية، مثل التعرف على الرموز المعقدة وتحليل اللوحات الفنية من منظور علمي، مما يعكس قدرته على دمج العلم مع الحياة اليومية.

Related Links