Command Palette
Search for a command to run...
يحقق MiniCPM5-1B، الذي تم تدريبه باستخدام RL+OPD، أداءً متطورًا (SOTA) في مهام معقدة متعددة؛ تم إصدار مجموعة بيانات CHI-Bench لتقييم العوامل الطبية، المصممة لأتمتة عمليات الرعاية الصحية المعقدة.

MiniCPM5-1B هو نموذج لغوي مفتوح المصدر يحتوي على مليار مُعامل، مُصمم خصيصًا للنشر على الحافة وفي بيئات محدودة الموارد. وهو النموذج الأول في سلسلة MiniCPM5. يستند إلى بنية Llama القياسية، ويُقدم ميزات تشمل... نموذج استدلال هجين قائم على الوسوم. علاوة على ذلك، يستفيد هذا النموذج من تقنيات تدريب متقدمة للتعلم المعزز والتحليل الإدراكي لتحسين الأداء الأساسي بشكل ملحوظ مع التخلص الفعال من تكرار المخرجات. وهو يدعم بشكل أصلي سياقات طويلة للغاية تصل إلى 131 ألف حرف.لقد حقق مستوى متطورًا للغاية (SOTA) يبلغ 1 مليار في المهام المعقدة مثل استدعاء الوكيل وتوليف التعليمات البرمجية.يتجنب هذا النموذج بشكل فعال معضلات زمن الاستجابة والخصوصية للاستدلال القائم على السحابة، مما يوفر حلاً مثالياً لبناء منصة ذكاء اصطناعي محلية فعالة.
يعرض موقع HyperAI الإلكتروني الآن "MiniCPM5-1B: وحدة معالجة خطية عالية الكفاءة بسعة 1 مليار بايت لتطبيقات الحافة". جربها!
الاستخدام عبر الإنترنت:https://go.hyper.ai/OBlhv
نرحب بكم لزيارة موقعنا الإلكتروني الرسمي لمزيد من المعلومات:
نظرة سريعة على التحديثات على موقع hyper.ai الإلكتروني من 30 مايو إلى 5 يونيو:
* مجموعات البيانات العامة عالية الجودة: 6
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 5
* تحليل مقالات المجتمع: مقال واحد
* إدخالات الموسوعة الشعبية: 5
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات تقييم معايير الوكلاء الأذكياء الطبيين chi-bench
مجموعة بيانات chi-bench هي مجموعة بيانات لتقييم وكلاء الرعاية الصحية، أصدرتها شركة Actava AI عام 2026. تُنشئ هذه المجموعة بيئة محاكاة عالية الدقة لأعمال الرعاية الصحية، حيث تدمج 20 نظامًا لتطبيقات الرعاية الصحية عبر واجهة MCP (بروتوكول سياق النموذج) المفتوحة، وتوفر قاعدة معرفية تضم 1279 وثيقة تشغيلية في مجال الرعاية الصحية. تغطي سيناريوهات التقييم ثلاثة مجالات رئيسية في نظام الرعاية الصحية الأمريكي: إدارة الموافقات المسبقة، وإدارة الاستشهادات لشركات التأمين الصحي ومقدمي خدمات التأمين، وإدارة رعاية السكان.
الاستخدام عبر الإنترنت:https://go.hyper.ai/j8pCr
2. مجموعة بيانات SMOL للترجمة المتوازية متعددة اللغات
SMOL هي مجموعة بيانات ترجمة احترافية أطلقتها جوجل عام 2025. تتضمن هذه المجموعة نصوصًا مترجمة باحترافية إلى 221 لغة، منها الأمهرية والسواحيلية والعفارية، بالإضافة إلى لغات أخرى أقل شيوعًا في البيانات/لغات إقليمية ذات بيانات شحيحة. تغطي المجموعة نطاقًا واسعًا من أزواج اللغات، بما في ذلك الترجمات الاحترافية والنصوص التي ساهم بها متطوعون، وتضيف بيانات متخصصة وشروحًا واقعية متعلقة بالمجال الطبي لبعض اللغات.
الاستخدام عبر الإنترنت:https://go.hyper.ai/84QS4
3. مجموعة بيانات قاعدة المعرفة المستهدفة لـ TACK Chimera
تُعدّ TACK مجموعة بيانات معيارية وقاعدة معرفية موحدة، أُصدرت من قِبل مختبر الذكاء الاصطناعي للهندسة الجزيئية عام 2026. وتهدف إلى معالجة مشكلات ندرة البيانات، ونقص التقييم الدقيق، ومحدودية التغطية في معايير التعلّم الآلي الحالية لـ PROTAC. وتُستخدم على نطاق واسع في مجالات مثل التنبؤ بنشاط تحلل PROTAC، وأبحاث التحلل البروتيني المُستهدف (TPD)، واكتشاف الأدوية بمساعدة الذكاء الاصطناعي (AIDD)، وتصميم الأدوية بمساعدة الحاسوب (CADD)، والفحص الافتراضي للأدوية، والتعلم متعدد المهام، والتنبؤ بالخصائص الجزيئية، وأبحاث الشبكات العصبية البيانية، واختبار معايير التعلّم الآلي.
الاستخدام عبر الإنترنت:https://go.hyper.ai/7gDJu
4. مجموعة بيانات EAVSD لقصص الفيديو الإعلانية للتجارة الإلكترونية
EAVSD هي مجموعة بيانات لقصص الفيديو الإعلانية للتجارة الإلكترونية، أصدرها فريق من جامعة بكين عام 2026. تهدف هذه المجموعة إلى دعم مهام توليد الصور المتعددة الموجهة نحو الموضوع وتخطيط السرد. تُستخدم هذه المجموعة على نطاق واسع في مهام توليد الصور المتعددة الموجهة نحو الموضوع وتخطيط السرد، مع التركيز بشكل أساسي على توليد قصص الفيديو الإعلانية للتجارة الإلكترونية وأبحاث التناسق البصري بعيد المدى القابل للتحكم.
الاستخدام عبر الإنترنت:https://go.hyper.ai/hyzLx
5. مجموعة بيانات DeepCrack للكشف عن تشققات البنية التحتية
DeepCrack هي مجموعة بيانات مرجعية لكشف تشققات البنية التحتية، مقدمة من مختبر رؤية الحاسوب والاستشعار عن بعد بجامعة ووهان. تهدف هذه المجموعة إلى توفير بيانات تعلم مُشرف موحدة وعالية الدقة لدعم أبحاث خوارزميات كشف التشققات. يمكن استخدامها مباشرةً لتدريب وتقييم نماذج التعلم العميق مثل U-Net وDeepLab وSegNet، وتُستخدم على نطاق واسع في مجالات بحثية مثل مراقبة سلامة الهياكل، وفحص الطرق، وتحديد عيوب المباني.
الاستخدام عبر الإنترنت:https://go.hyper.ai/88zlH

6. مجموعة بيانات تلوث الهواء العالمي ومؤشر جودة الهواء
تُعدّ قاعدة بيانات تلوث الهواء ومؤشر جودة الهواء العالمية (World Air Pollution and AQI) قاعدة بيانات عالمية لجودة الهواء تُستخدم في البحث وتحليل البيانات. تحتوي هذه القاعدة على بيانات رصد شهرية على مستوى المدن للفترة من 2014 إلى 2025، بإجمالي 331,920 سجلاً، تغطي 24 دولة في 5 قارات، بما في ذلك الصين والولايات المتحدة والمملكة المتحدة وفرنسا وألمانيا واليابان وكوريا الجنوبية. وتشمل 24 خاصية، تتضمن تركيزات ملوثات الهواء، ومؤشر جودة الهواء، والمتغيرات المناخية، والمؤشرات الاجتماعية والبيئية.
الاستخدام عبر الإنترنت:https://go.hyper.ai/QL8VK
دروس تعليمية عامة مختارة
1. MiniCPM5-1B: وحدة LLM أحادية عالية الكفاءة لتطبيقات الحافة
يُعدّ MiniCPM5-1B أول نموذج في سلسلة MiniCPM5 التي أصدرها فريق OpenBMB. صُمّم هذا النموذج خصيصًا للنشر على الحافة وفي بيئات محدودة الموارد. يعتمد على بنية Transformer كثيفة المعاملات (1 مليار)، ويحقق أداءً متميزًا بين نماذج المصادر المفتوحة ذات الحجم المماثل. يتميز هذا النموذج بكفاءة عالية في استدعاءات أدوات الوكلاء، وتوليد التعليمات البرمجية، ومهام الاستدلال المعقدة.
تشغيل عبر الإنترنت:https://go.hyper.ai/OBlhv

2. نظام توليد الصور HiDream-O1-Image
يُعدّ HiDream-O1-Image نموذجًا أساسيًا أصليًا وموحدًا لتوليد الصور، أطلقه فريق HiDream.ai في عام 2026. ويعتمد هذا النموذج على بنية محوّل موحد (UiT) على مستوى البكسل. وعلى عكس النماذج التقليدية، لا يعتمد على محوّلات VAE خارجية أو مشفّرات نص منفصلة، بل يقوم بتشفير البكسلات والنصوص بشكل أصلي ضمن مساحة رمزية مشتركة واحدة.
تشغيل عبر الإنترنت:https://go.hyper.ai/XkyGK

3. X2SAM: نموذج موحد لتقسيم الصور والفيديوهات ذات الأشكال العشوائية
يُعدّ X2SAM، الذي أُطلق في أبريل 2026 من قِبل جامعة صن يات صن ومختبر بنغتشنغ وفريق ميتوان، نموذجًا متعدد الوسائط واسع النطاق لسيناريوهات تجزئة الصور والفيديوهات الموحدة. وتتمثل الميزة الأساسية لهذا المشروع في توحيده للمطالبات النصية والمرئية وتجزئة الصور/الفيديوهات في عملية تفاعلية واحدة.
تشغيل عبر الإنترنت:https://go.hyper.ai/OAndb

4. LocateAnything-3B: نموذج سريع وعالي الجودة لتحديد موقع اللغة المرئية
أصدرت شركة NVIDIA في عام 2026 نموذج LocateAnything-3B، وهو نموذج لتحديد موقع اللغة المرئية ذو 3B معلمات، ضمن سلسلة Eagle VLM، مصمم لمهام مثل اكتشاف الكائنات المفتوحة، وتحديد موقع التعبيرات النقطية، وتحديد موقع النصوص بتقنية التعرف الضوئي على الحروف (OCR)، وتحديد موقع عناصر واجهة المستخدم الرسومية، والإشارة في الصور والفيديوهات. تتمثل الميزة الأساسية لهذا النموذج في فك تشفير المربعات المتوازية: حيث يتنبأ بإحداثيات المربع المحيط الكاملة على شكل كتل منظمة بالتوازي، بدلاً من توليد الإحداثيات من خلال الانحدار الذاتي لكل رمز على حدة، مما يحسن إنتاجية تحديد الموقع مع الحفاظ على التناسق الهندسي.
تشغيل عبر الإنترنت:https://go.hyper.ai/DxUFC

5. Granite 4.1 8B: يدعم الحوار، والترميز، وRAG، واستدعاءات الأدوات.
تُمثل نماذج لغة Granite 4.1 جيلاً جديداً من النماذج الأساسية مفتوحة المصدر، أطلقتها شركة IBM عام 2026، وتشمل بنى فك تشفير كثيفة بثلاثة أحجام: 3 مليارات، و8 مليارات، و30 مليار. ويُعدّ Granite 4.1 8 مليارات، باعتباره الإصدار عالي الأداء في هذه السلسلة، حيث يُحقق الأداء الفائق المطلوب لتطبيقات المؤسسات مع الحفاظ على حجم معلمات صغير. يدعم هذا النموذج بشكل أصلي إمكانيات تعدد اللغات، ومجموعة واسعة من مهام التشفير، وتقنية توليد تحسينات الاسترجاع (RAG)، واستخدام الأدوات، وإخراج JSON مُهيكل، مما يوفر دعماً تقنياً قوياً للتطبيقات العملية.
تشغيل عبر الإنترنت:https://go.hyper.ai/Fpzl7

تفسير مقالة المجتمع
1. تقترح جامعة سنغافورة الوطنية عملية تعاونية بين الذكاء الاصطناعي والكيمياء الحاسوبية لتسريع إعادة توظيف الأدوية لعلاج جروح مرضى السكري، مما يقلل دورة البحث والتطوير بأكثر من 701 TP3T!
اقترح فريق بحثي في جامعة سنغافورة الوطنية عملية بحثية تعاونية في مجال الطب النانوي الحاسوبي، تجمع بين الذكاء الاصطناعي والكيمياء الحاسوبية. تربط هذه العملية بشكل وثيق بين استخراج المعلومات من الأدبيات العلمية باستخدام نماذج لغوية ضخمة (للحصول على رؤى نوعية) والمحاكاة الجزيئية متعددة المراحل التي تهيمن عليها الكيمياء الحاسوبية (للتحقق الكمي)، مما يُنشئ نظامًا بحثيًا متكاملًا لدراسة التفاعلات النانوية بين الأدوية والبروتينات، ويُسرّع من إعادة توظيف وتطوير الأدوية لعلاج جروح مرضى السكري.
شاهد التقرير الكامل:https://go.hyper.ai/OXs3N
مقالات موسوعية شعبية
1. نموذج العمل العالمي (WAM)
2. نموذج اللغة المرئية والفعل (VLA)
3. العنصر البشري في الحلقة
4. التعلم أثناء النشر
5. دمج الرتب المتبادل
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* يوفر نقاط تنزيل محلية معجلة لأكثر من 2100 مجموعة بيانات عامة
* يتضمن أكثر من 700 درس تعليمي كلاسيكي وشائع عبر الإنترنت
* تحليل أكثر من 300 دراسة حالة من أوراق بحثية حول الذكاء الاصطناعي للعلوم
* يدعم البحث عن أكثر من 700 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:








