HyperAIHyperAI

Command Palette

Search for a command to run...

قامت شركة Tencent بفتح نموذج الترجمة Hy-MT1.5: 440MB يحقق قدرات ترجمة من الدرجة الأولى؛ وقام معهد ماساتشوستس للتكنولوجيا بإصدار MathNet بشكل مشترك: وهو معيار استدلال رياضي متعدد الوسائط يغطي 27000 مسألة رياضية حقيقية من أولمبياد الرياضيات.

Featured Image

Hy-MT1.5-1.8B-1.25bit هو نموذج ترجمة آلية خفيف الوزن أطلقته شركة Tencent. وهو مبني على Hy-MT1.5-1.8B وتم تحسينه من خلال تدريب متعدد المراحل، بما في ذلك التدريب المسبق للترجمة الآلية، والضبط الدقيق الخاضع للإشراف، والتقطير، والتعلم المعزز.يدعم النموذج 33 لغة و5 لهجات ولغات الأقليات و1056 اتجاه ترجمة.بفضل 1.8 مليار معلمة فقط، تجاوز أداء الترجمة الخاص بها أداء بعض النماذج مفتوحة المصدر واسعة النطاق وواجهات برمجة تطبيقات الترجمة التجارية السائدة.

يعرض موقع HyperAI الآن "Hy-MT1.5-1.8B-1.25bit: نموذج ترجمة متعدد اللغات خفيف الوزن". جربه!

الاستخدام عبر الإنترنت:https://go.hyper.ai/PCK8X

نرحب بكم لزيارة موقعنا الإلكتروني الرسمي لمزيد من المعلومات:

https://hyper.ai

نظرة سريعة على تحديثات الموقع الرسمي لشركة hyper.ai من 6 مايو إلى 15 مايو:

* مجموعات بيانات عامة عالية الجودة: 12

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 7

* تفسير مقالة المجتمع: 3 مقالات

* إدخالات الموسوعة الشعبية: 5

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات فهم الرسم البياني لمعايرة الكم QCalEval

تُعدّ QCalEval، التي أطلقتها NVIDIA عام 2026، مجموعة بيانات لغوية بصرية لفهم الرسوم البيانية في تجارب الحوسبة الكمومية. تهدف هذه المجموعة إلى تقييم قدرة نماذج اللغة البصرية (VLMs) على تفسير وتصنيف وتحليل نتائج تجارب معايرة الحوسبة الكمومية، وتُستخدم على نطاق واسع في أبحاث نماذج اللغة البصرية وفهم الصور العلمية. تحتوي مجموعة البيانات على 309 صورة علمية ثنائية الأبعاد بصيغة PNG، و243 مدخلًا معياريًا، و236 مدخلًا معياريًا لعدد قليل من الأمثلة، تغطي 22 سلسلة تجريبية و87 نوعًا من المشاهد.

الاستخدام عبر الإنترنت:https://go.hyper.ai/Ke7cu

2. مجموعة بيانات Claw-Eval المعيارية في العالم الحقيقي

تُعدّ مجموعة بيانات Claw-Eval، التي أطلقتها جامعة بكين وجامعة هونغ كونغ عام 2026، معيارًا شاملاً وشفافًا لتقييم أداء أنظمة الذكاء الاصطناعي في مهام واقعية. وتهدف إلى تقييم قدرات الأنظمة المستقلة في تنفيذ المهام، واستخدام الأدوات، والفهم متعدد الوسائط، والتفاعل متعدد المراحل في بيئات واقعية. تدعم مجموعة البيانات اللغتين الإنجليزية والصينية، وتتضمن ثلاث مجموعات مهام رئيسية: عامة، ومتعددة الوسائط، ومتعددة المراحل، وتغطي 24 فئة من المهام، مثل التواصل، والتمويل، والعمل المكتبي، وأدوات الإنتاجية.

الاستخدام عبر الإنترنت:https://go.hyper.ai/Tznpa

3. مجموعة بيانات MathNet متعددة الوسائط للاستدلال الرياضي المعياري

MathNet هي مجموعة بيانات واسعة النطاق ومتعددة اللغات والوسائط للاستدلال الرياضي، أُصدرت عام 2026 من قِبل فريق معهد ماساتشوستس للتكنولوجيا بالتعاون مع جامعة الملك عبد الله للعلوم والتقنية ومؤسسات أخرى. تهدف هذه المجموعة إلى تقييم وتحسين قدرات النماذج الكبيرة في مهام الاستدلال الرياضي والاسترجاع المنظم على مستوى الأولمبياد، وتُستخدم على نطاق واسع في تقييم الاستدلال الرياضي، وأبحاث RAG، وتدريب الذكاء الاصطناعي متعدد الوسائط.

الاستخدام عبر الإنترنت:https://go.hyper.ai/HLxNw

4. مجموعة بيانات أساسية لفهم تغيرات المناطق عن بُعد من مركز أبحاث الاستشعار عن بُعد (RSRCC)

تُعدّ مجموعة بيانات RSRCC، التي أطلقتها جوجل للأبحاث عام 2026، مرجعًا أساسيًا لفهم التغيرات الدلالية في الاستشعار عن بُعد. وتهدف إلى دعم فهمٍ معمقٍ للتغيرات الزمنية في مشاهد الاستشعار عن بُعد من خلال دمج أدلة الصور متعددة الأوقات مع الإجابة على الأسئلة باللغة الطبيعية، ما يرتقي بالكشف التقليدي عن التغيرات الثنائية إلى بُعد وصف التغيرات الدلالية. تحتوي مجموعة البيانات على 126,000 عينة من الأسئلة والأجوبة للكشف عن التغيرات في الاستشعار عن بُعد، وتغطي سيناريوهات مثل الإنشاءات الجديدة، والهدم، وتغييرات الطرق، والتغيرات النباتية، والتطوير السكني.

الاستخدام عبر الإنترنت:https://go.hyper.ai/jtCaK

5. مجموعة بيانات الكشف عن النفايات الطبية

مجموعة بيانات النفايات الطبية هي مجموعة بيانات صور عالية الدقة مصممة للتعرف الذكي على النفايات الطبية والكشف عنها. تهدف هذه المجموعة إلى مساعدة نماذج رؤية الحاسوب على تحقيق الكشف والتصنيف التلقائي للنفايات الطبية في البيئات الطبية المعقدة، وتُستخدم على نطاق واسع في مجالات بحثية مثل الرعاية الصحية الذكية، والصحة العامة، وفرز النفايات الآلي، ورؤية الروبوتات. 

الاستخدام عبر الإنترنت:https://go.hyper.ai/PrUKd

6. مجموعة بيانات أمراض أوراق العنب

مجموعة بيانات GRAPE Leaf Diseases هي مجموعة بيانات صور لأوراق العنب مصممة خصيصًا لمهام الكشف عن الأهداف في الزراعة الدقيقة، بهدف تحسين قدرة نماذج رؤية الحاسوب على اكتشاف الأمراض وتصنيفها وتحديد مواقعها في بيئات زراعية حقيقية. تحتوي مجموعة البيانات على 4195 صورة لأوراق العنب، تغطي أربع فئات: أوراق العنب السليمة، وثلاثة أمراض شائعة: العفن الأسود، ومرض إسكافيه فولفا، ولفحة الأوراق.

الاستخدام عبر الإنترنت:https://go.hyper.ai/tJrkm

7. أطلس الحياة البرية المائية: مجموعة بيانات عالمية عن الحياة المائية.

أطلس الحياة البرية المائية: سجلات الأنواع العالمية هو مجموعة بيانات واسعة النطاق لرصد الحيوانات المائية، مصممة خصيصًا لأبحاث البيئة المائية وتحليل التنوع البيولوجي. ويهدف إلى تزويد الباحثين والطلاب وعلماء البيانات بموارد بيانات بيئية مائية عالية الجودة. تحتوي مجموعة البيانات على 200,000 سجل لرصد الحيوانات المائية، تغطي أكثر من 100 نوع مائي، وتشمل النظم البيئية المائية الرئيسية حول العالم، بما في ذلك الشعاب المرجانية والأنهار الاستوائية والمحيط المتجمد الشمالي ومناطق أعماق البحار التي يصل عمقها إلى 7,000 متر.

الاستخدام عبر الإنترنت:https://go.hyper.ai/calNa

8. الزلازل العالمية - 4.5 درجة: مجموعة بيانات عالمية للزلازل التي تبلغ قوتها 4.5 درجة وما فوق.

مجموعة بيانات الزلازل العالمية - بقوة 4.5 درجة فأكثر هي مجموعة بيانات عالمية لأحداث الزلازل، مصممة لتحليل النشاط الزلزالي والبحوث الجغرافية المكانية. تهدف هذه المجموعة إلى مساعدة الباحثين على تحليل تواتر وتوزيع وتغيرات قوة الزلازل على المدى الطويل. تحتوي مجموعة البيانات على 230,608 سجلاً زلزالياً، تغطي الزلازل العالمية التي بلغت قوتها 4.5 درجة فأكثر خلال الفترة من 1900 إلى 2026.

الاستخدام عبر الإنترنت:https://go.hyper.ai/D7j95

9. مجموعة بيانات فعالية الأدوية الاصطناعية

تُعدّ قاعدة بيانات فعالية الأدوية الاصطناعية مجموعة بيانات مُنشأة خصيصًا لدعم تحليل سلامة الأدوية وتقييم المخاطر السريرية، وهي مناسبة لتحليل البيانات وبناء النماذج والبحوث التجريبية. تحتوي هذه المجموعة على معلومات طبية مُهيكلة حول استخدام الأدوية ومراقبة الآثار الجانبية. يُفهرس كل سجل برقم تقرير فريد، ويتضمن معلومات أساسية مثل عمر المريض وجنسه، بالإضافة إلى تفاصيل العلاج كاسم الدواء وجرعته ومدة استخدامه والأدوية المصاحبة له.

الاستخدام عبر الإنترنت:https://go.hyper.ai/1ZaA0

10. مجموعة بيانات تصنيف أمراض قاع العين

مجموعة بيانات تصنيف أمراض العيون لقاع العين هي مجموعة بيانات طبية بصرية مصممة خصيصًا لتصنيف صور قاع العين، بهدف تحسين قدرات نماذج الرؤية الحاسوبية في تحديد أمراض العيون وتشخيصها. تحتوي مجموعة البيانات على 6086 صورة، تشمل أربع فئات من صور قاع العين: إعتام عدسة العين، واعتلال الشبكية السكري، والزرق، وقاع العين الطبيعي.

الاستخدام عبر الإنترنت:https://go.hyper.ai/FFFE7

11. سرطان الثدي: مجموعة بيانات دمج متعددة الوسائط

سرطان الثدي: دمج متعدد الوسائط هو مجموعة بيانات متعددة الوسائط مُعالجة مسبقًا، مصممة خصيصًا لمرضى سرطان الثدي الغازي، لتوفير أساس جاهز للاستخدام لبناء شبكات دمج متعددة الوسائط. تُنسق هذه المجموعة بدقة بيانات متعددة المصادر من 122 مريضًا بسرطان الثدي الغازي، حيث تم ربط جميع العينات عبر الوسائط باستخدام معرّفات حالات TCGA، مما يحقق تطابقًا تامًا بين التصوير الطبي الكلي (التصوير بالرنين المغناطيسي)، وعلم الأمراض الرقمي المجهري (علم الأنسجة المرضية)، وعلم الجينوم الجزيئي (علم الجينوم المتعدد)، ومعلومات العلاج السريري.

الاستخدام عبر الإنترنت:https://go.hyper.ai/199WV

12. مجموعة بيانات الكشف عن حرائق الغابات والدخان من مسافات بعيدة

مجموعة بيانات "الكشف عن حرائق الغابات والدخان من مسافات بعيدة" هي مجموعة بيانات رؤية حاسوبية مصممة للإنذار المبكر والرصد البيئي لحرائق الغابات. تهدف هذه المجموعة إلى تحسين قدرة النموذج على رصد الدخان وحرائق الغابات في سيناريوهات الرصد عن بُعد. تم توليد هذه المجموعة باستخدام منهجية اصطناعية بالكامل، تحاكي سيناريوهات الرصد من زوايا عالية ولمسافات طويلة، مثل أبراج مراقبة حرائق الغابات وكاميرات المراقبة على قمم التلال، مع التركيز على رصد أعمدة دخان حرائق الغابات، التي يسهل رصدها في المراحل المبكرة من الحريق.

الاستخدام عبر الإنترنت:https://go.hyper.ai/LnuXC

دروس تعليمية عامة مختارة

1. Hy-MT1.5-1.8B-1.25bit: نموذج ترجمة متعدد اللغات خفيف الوزن

يُعدّ Hy-MT1.5-1.8B-1.25bit، الذي أصدرته شركة Tencent في أبريل 2026، نموذج ترجمة متعددة اللغات مُكمّمًا بدقة 1.25 بت، ويعتمد على Hy-MT1.5-1.8B. تكمن القيمة الأساسية لهذا النموذج في ضغط إمكانيات الترجمة متعددة اللغات عالية الجودة في شكل نشر أخف وزنًا.

تشغيل عبر الإنترنت:https://go.hyper.ai/PCK8X

صفحة العرض التوضيحي

2. Uni-Mol: إطار عمل عام لتعلم تمثيل الجزيئات ثلاثية الأبعاد

Uni-Mol هو إطار عمل للتدريب المسبق الجزيئي ثلاثي الأبعاد للأغراض العامة تم إصداره بواسطة DP Technology في عام 2022. يعمل Uni-Mol على توسيع قدرات التمثيل الجزيئي من خلال التدريب المسبق واسع النطاق للهيكل الجزيئي ثلاثي الأبعاد ويمكن استخدامه في مهام مثل تصميم الأدوية والتنبؤ بالخصائص الجزيئية ونمذجة تفاعل البروتين مع الربيطة.

تشغيل عبر الإنترنت:https://go.hyper.ai/RukIx

صفحة العرض التوضيحي

3. تثبيت Mistral-Medium-3.5-128B بنقرة واحدة

يُعدّ نموذج Mistral Medium 3.5، الذي أطلقته شركة Mistral AI عام 2025، نموذجًا رائدًا في مجال دمج البيانات، إذ يضم 128 مليار مُعامل و256 ألف نافذة سياقية، موحّدًا بذلك إمكانيات الامتثال للتعليمات والاستدلال والبرمجة ضمن مجموعة واحدة من الأوزان. وقد حلّ هذا النموذج محلّ نموذجي Mistral Medium 3.1 وMagistral السابقين، كما حلّ محلّ Devstral 2 في وكيل برمجة Vibe.

تشغيل عبر الإنترنت:https://go.hyper.ai/PXiHc

صفحة العرض التوضيحي

4. OmniVoice: يدعم تحويل النص إلى كلام عالي الجودة بأكثر من 600 لغة.

OmniVoice هو نموذج متعدد اللغات لتحويل النص إلى كلام (TTS) طوّره فريق Kaldi من الجيل التالي التابع لمختبر Xiaomi AI، ويدعم توليف الكلام عالي الجودة بأكثر من 600 لغة. يعتمد المشروع على بنية فك تشفير تكرارية غير مقنعة، وينفذ ثلاث وظائف أساسية: استنساخ الصوت، وتصميم الصوت، والصوت التلقائي.

تشغيل عبر الإنترنت:https://go.hyper.ai/7F7IR

صفحة العرض التوضيحي

5. MiniCPM-V-4.6: نموذج لغة مرئية متعدد الوسائط عالي الكفاءة للأجهزة الطرفية

يُعدّ MiniCPM-V-4.6، الذي أصدره فريق OpenBMB ومختبر معالجة اللغات الطبيعية بجامعة تسينغهوا في مايو 2026، نموذجًا فعالًا للغة المرئية متعددة الوسائط يعمل على مستوى الحافة، ويُستخدم لفهم الصور والفيديوهات، والإجابة على الأسئلة المرئية، والتعرف الضوئي على الأحرف (OCR)، وسيناريوهات الحوار متعدد الوسائط متعدد المراحل. تكمن قيمته الأساسية في تغطيته لمهام الفهم متعددة الوسائط الشائعة بحجم نموذج صغير نسبيًا، مما يجعله أكثر ملاءمة للإجابة على أسئلة الصور، وتلخيص مقاطع الفيديو القصيرة، وفهم لقطات الشاشة، والتعرف الضوئي على الأحرف في صور المستندات، والتحقق من صحة الحوار متعدد الوسائط متعدد المراحل في البيئات ذات الموارد المحدودة.

تشغيل عبر الإنترنت:https://go.hyper.ai/azdHU

صفحة العرض التوضيحي

6. LingBot-Map: محول السياق الهندسي لإعادة بناء ثلاثية الأبعاد متدفقة

LingBot-Map هو مشروع لإعادة بناء المشاهد ثلاثية الأبعاد عبر البث المباشر، أطلقه فريق Robbyant في أبريل 2026. يستقبل المشروع تسلسلات الصور أو إطارات الفيديو كمدخلات، ويُمكنه إعادة بناء المشاهد ثلاثية الأبعاد عبر الإنترنت بطريقة التغذية الأمامية. يُمكن عرض سحب النقاط ومسارات الكاميرا والنتائج إطارًا بإطار من خلال عارض ثلاثي الأبعاد في متصفح الإنترنت.

تشغيل عبر الإنترنت:https://go.hyper.ai/BR4me

صفحة العرض التوضيحي

7. HY-Embodied-0.5: نموذج أساسي مجسد للوكلاء الأذكياء في العالم الحقيقي

يُعدّ HY-Embodied-0.5 نموذجًا أساسيًا مصممًا خصيصًا للذكاء المُجسّد، وقد تمّ طرحه كمصدر مفتوح بشكل مشترك من قِبل فريق Hunyuan التابع لشركة Tencent ومختبر Tencent Robotics X Lab في أبريل 2026. لا تُمثّل هذه السلسلة من النماذج مجرد تعديل بسيط لنموذج عام، بل إعادة بناء كاملة من حيث البنية ونموذج التدريب. وقد أصدر الفريق في الوقت نفسه نموذجين رئيسيين: MoT-2B (بإجمالي 4 مليارات مُعامل، و2 مليار عملية تنشيط) الذي يُركّز على الاستجابة الآنية من جانب الحافة، وMoE-32B (بإجمالي 407 مليار مُعامل، و32 مليار عملية تنشيط) الذي يسعى إلى تحقيق أعلى أداء استدلالي.

تشغيل عبر الإنترنت:https://go.hyper.ai/u8lJk

صفحة العرض التوضيحي

تفسير مقالة المجتمع

1. EnergAIzer، وهو إطار عمل لتقدير طاقة وحدة معالجة الرسومات تم تطويره بواسطة معهد ماساتشوستس للتكنولوجيا وآخرين، يكمل التنبؤات في متوسط 1.8 ثانية مع خطأ يبلغ حوالي 81 TP3T.

طوّر باحثون من معهد ماساتشوستس للتكنولوجيا ومختبر الذكاء الاصطناعي المشترك بين معهد ماساتشوستس للتكنولوجيا وشركة آي بي إم واتسون، برنامج EnergAIzer، وهو إطار عمل سريع لتقدير استهلاك الطاقة في وحدات معالجة الرسومات (GPU) لأحمال عمل الذكاء الاصطناعي، حيث يوفر معلومات استخدام الأجهزة مباشرةً لنماذج الطاقة دون الحاجة إلى عمليات محاكاة مكلفة أو تحليل أداء. يُنجز هذا الإطار الجديد عملية تقدير الطاقة الشاملة في غضون 1.8 ثانية فقط في المتوسط. على وحدات معالجة الرسومات NVIDIA Ampere، يحقق EnergAIzer هامش خطأ في استهلاك الطاقة يبلغ حوالي 81 TP3T، وهو ما يُضاهي النماذج التقليدية التي تعتمد على عمليات محاكاة معقدة ودورية أو تحليل أداء الأجهزة.

شاهد التقرير الكامل:https://go.hyper.ai/1PeMV

2. انخفض استخدام الرموز المميزة بمقدار 30%. Eywa، وهو إطار عمل للوكلاء الأذكياء غير المتجانسين مستوحى من "Avatar"، يجمع بكفاءة بين نماذج اللغة والنماذج الأساسية الخاصة بالمجال.

اقترح فريق بحثي من جامعة إلينوي في أوربانا-شامبين (UIUC) إطار عمل "إيوا" (Eywa)، وهو إطار عمل للوكلاء غير المتجانسين لربط وكلاء اللغة بنماذج أساسية خاصة بمجال معين. ومن خلال الجمع بين النماذج الأساسية الخاصة بمجال معين ونماذج اللغة، ابتكر الباحثون وكيل "إيوا" (EywaAgent) الجديد، وهو تصميم يمكّن وكيل اللغة من توجيه عمليات التفكير والتخطيط واتخاذ القرارات في النموذج الأساسي في مهامه المتخصصة.

شاهد التقرير الكامل:https://go.hyper.ai/CzRL4

3. أطلقت مائة جامعة أكبر دراسة متعددة المجموعات في العالم في مجال علم البروتينات الجينومية، والتي تكشف عن الجينات المسببة للأمراض وتعيد استخدام الأدوية الموجودة بناءً على بيانات من حوالي 80 ألف مشارك.

نشر فريق من أكثر من مئة جامعة ومؤسسة بحثية، من بينها جامعة كوين ماري بلندن وجامعة كامبريدج، أكبر دراسة في العالم حتى الآن في مجال علم البروتينات الجينومية متعددة المجموعات. استنادًا إلى تحليل تجميعي واسع النطاق لبيانات البروتينات الجينومية، شمل 38 مجموعة بحثية مستقلة و78,664 مشاركًا، حددت الدراسة بشكل منهجي 24,738 موقعًا جينيًا كميًا للبروتينات، وربطتها بـ 1,116 بروتينًا دورانيًا، كاشفةً بشكل شامل عن الخصائص التنظيمية الجينية القريبة والبعيدة على مستوى البروتين.

شاهد التقرير الكامل:https://go.hyper.ai/lGD68

مقالات موسوعية شعبية

1. نماذج العالم

2. منحنى المعايرة

3. الانتباه المُوجَّه

4. العنصر البشري في الحلقة

5. اندماج الرتب المتبادلة

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* يوفر نقاط تنزيل محلية معجلة لأكثر من 2100 مجموعة بيانات عامة

* يتضمن أكثر من 700 درس تعليمي كلاسيكي وشائع عبر الإنترنت

* تحليل أكثر من 300 دراسة حالة من أوراق بحثية حول الذكاء الاصطناعي للعلوم

* يدعم البحث عن أكثر من 700 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai