Command Palette
Search for a command to run...
خفيف الوزن للغاية، ومع ذلك بجودة صورة لا تقل عن سابقتها! ERNIE-Image-Turbo: وداعاً للانتظار الطويل، سرعة فائقة؛ نقدم لكم مقاييس ثنائية الأبعاد للإدراك والمعرفة: مجموعة بيانات OmniParsingBench الموحدة متعددة الوسائط لتحليل وتقييم البيانات من Alibaba متاحة الآن عبر الإنترنت.

يُعدّ ERNIE-Image-Turbo نموذجًا عالي الكفاءة لتحويل النصوص إلى صور، وهو مفتوح المصدر من شركة بايدو. يعتمد هذا النموذج على بنية محوّل الانتشار أحادي التدفق (DiT) ومُحسّن بشكل كبير باستخدام تقنيات DMD وRL، مما يُمكّنه من توليد صور عالية الدقة وذات مظهر جمالي في 8 خطوات استدلال فقط. كما يُساهم تصميمه الخفيف والممتاز في تقليل متطلبات الأجهزة اللازمة للتطبيقات والأبحاث بشكل ملحوظ.
مع الحفاظ على سرعة إنتاج فائقة، يتميز هذا النموذج بقدرة تحكم عالية وتعدد استخدامات كبير. فهو قادر على تنفيذ التعليمات بدقة متناهية، بما في ذلك تلك التي تتضمن عناصر متعددة وعلاقات معقدة، كما أنه يُحسّن بشكل ملحوظ قدرته على عرض النصوص الطويلة والكثيفة والتصميمات المنظمة، مما يجعله الخيار الأمثل لتصميم الملصقات والقصص المصورة متعددة اللوحات والرسوم البيانية. علاوة على ذلك، يدعم هذا النموذج بشكل كامل أنماطًا جمالية متنوعة، تشمل التصوير الفوتوغرافي الواقعي، وتصميم الخطوط، والمؤثرات السينمائية الناعمة، مما يجعله أداة مثالية تجمع بين الجودة البصرية والكفاءة الإبداعية العالية.
يتوفر الآن نموذج "ERNIE-Image-Turbo Raw Image Model" على موقع HyperAI الإلكتروني. جرّبه الآن!
الاستخدام عبر الإنترنت:https://go.hyper.ai/hmKUg
نرحب بكم لزيارة موقعنا الإلكتروني الرسمي لمزيد من المعلومات:
نظرة سريعة على تحديثات الموقع الرسمي لشركة hyper.ai من 18 أبريل إلى 24 أبريل:
* مجموعات بيانات عامة عالية الجودة: 9
* مجموعة مختارة من الدروس التعليمية عالية الجودة: 5
* تحليل مقالات المجتمع: مقالتان
* إدخالات الموسوعة الشعبية: 5
* أفضل المؤتمرات مع الموعد النهائي في أبريل: 1
قم بزيارة الموقع الرسمي:هايبر.اي
مجموعات البيانات العامة المختارة
1. مجموعة بيانات تقييم قدرة تحليل الوسائط المتعددة OmniParsingBench
تُعدّ OmniParsingBench، التي أطلقتها شركة Alibaba عام 2026، مجموعة بيانات مرجعية لتقييم قدرات التحليل الموحد للنماذج متعددة الوسائط الكبيرة (MLLM). تحتوي هذه المجموعة على ما يقارب 5294 عينة، تغطي ستة مجالات وسائطية (الصور الطبيعية، والرسومات، والمستندات، والصوت، والفيديو الطبيعي، والفيديو الغني بالنصوص)، وتُقدّم ثلاثة مستويات من مقاييس التقييم: الإدراك (Perc.)، والمعرفة (Cog.)، والتقييم الشامل (Ovr.). تتضمن كل مجموعة بيانات صورة أو مدخل صوتي/فيديو، ومهمة تحليل مُهيكلة مُقابلة.
الاستخدام عبر الإنترنت:https://go.hyper.ai/AqyDg
2.مجموعة بيانات تقييم المباني المتضررة من الكوارث BRIGHT
BRIGHT هي أول مجموعة بيانات مرجعية عالمية مفتوحة الوصول وموزعة عالميًا ومتعددة الوسائط لمشاهد الكوارث، تضم أنواعًا متنوعة من الأحداث، وتدمج الصور البصرية وبيانات الرادار ذي الفتحة التركيبية (SAR). تغطي هذه المجموعة 14 منطقة و7 أنواع من الكوارث (5 كوارث طبيعية + 2 من صنع الإنسان)، وتحتوي على ما يقارب 4200 زوج من الصور، تشمل أكثر من 380,000 مبنى، بدقة مكانية تتراوح بين 0.3 و1 متر تقريبًا. تتكون البيانات من صور ما قبل الكارثة، وصور ما بعد الكارثة، وبيانات تعريفية للأهداف.
الاستخدام عبر الإنترنت:https://go.hyper.ai/RifVg
3. زهرة: مجموعة بيانات لصور الزهور في بنغلاديش
مجموعة بيانات صور زهور بنغلاديش هي مجموعة بيانات مصممة خصيصًا لمهام تصنيف الصور باستخدام رؤية الحاسوب. تحتوي هذه المجموعة على صور حقيقية لأنواع مختلفة من الزهور التُقطت في بنغلاديش. جميع الصور أصلية وغير مُعدّلة، وقد تم التقاطها في ظروف إضاءة طبيعية، مما يُظهر تنوعًا غنيًا في الألوان. تغطي مجموعة البيانات نطاقًا واسعًا من أنواع الزهور المحلية وخصائصها المظهرية، وهي مُصنّفة حسب الفئة.
الاستخدام عبر الإنترنت:https://go.hyper.ai/wirun
4. مجموعة بيانات مسار الاستدلال واتخاذ القرار متعدد الخطوات MIA
تُعدّ مجموعة بيانات MIA (مسار الاستدلال واتخاذ القرار متعدد الخطوات)، التي أصدرتها جامعة شرق الصين للمعلمين ومعهد شنغهاي للابتكار ومعهد هاربين للتكنولوجيا في أبريل 2026، مجموعة بيانات تُستخدم لتدريب وتقييم الأنظمة الذكية ذات الذاكرة طويلة المدى وقدرات تنفيذ المهام. تحتوي هذه المجموعة على ما يقارب 21000 مسار استدلال، تغطي كامل عملية حل المشكلات والتخطيط والبحث والتنفيذ، وهي مناسبة لأبحاث استدلال الأنظمة الذكية والتعلم المعزز.
الاستخدام عبر الإنترنت:https://go.hyper.ai/XITit
5. مجموعة بيانات PanScale للاستشعار عن بعد لتحسين وضوح الصور الملونة
PanScale هي مجموعة بيانات مرجعية للاستدلال واسع النطاق وتقييم القدرات، صدرت عام 2026 عن الأكاديمية الصينية للعلوم بالتعاون مع جامعة العلوم والتكنولوجيا الصينية وجامعة هونغ كونغ للعلوم والتكنولوجيا. تحتوي هذه المجموعة على 7559 زوجًا من الصور متعددة الأطياف (MS) والصور أحادية اللون (PAN) بصيغة TIFF ذات 8 بت. وهي تغطي مجموعات فرعية متعددة تشمل جيلين، ولاندسات، وسكايسات، وتمتد لتشمل إصدارات متعددة المقاييس مثل fjilin وflandsat وfskysat، مما يدعم تقييم النظام للمشاهد من نفس المقياس إلى مقاييس متعددة (حتى 4.0x).
الاستخدام عبر الإنترنت:https://go.hyper.ai/mz2gh
6. مجموعة بيانات الكشف عن المشاعر باستخدام مجسات المشاعر
مجموعة بيانات Emotion-probes هي مجموعة بيانات نصية اصطناعية مصممة لفهم المشاعر ودراسة قابلية تفسير النماذج. تهدف هذه المجموعة إلى استخلاص متجهات المشاعر وقدرات إخفاء المشاعر من النماذج، وتُستخدم على نطاق واسع في تصنيف المشاعر، ومواءمة النماذج، وأبحاث الأمن السيبراني، وتحليل الآليات الداخلية للنماذج الكبيرة. تحتوي مجموعة البيانات على ما يقارب 447,000 عينة. تتضمن كل عينة حقولًا مثل المشاعر الحقيقية، والمشاعر المُعبر عنها، ومحتوى النص، ومعلومات الدور.
الاستخدام عبر الإنترنت:https://go.hyper.ai/jw5FA
7. مجموعة بيانات OpenMementos المضغوطة في ذاكرة السياق
OpenMementos هي مجموعة بيانات لضغط السياق والذاكرة، أصدرتها مايكروسوفت عام 2026، وهي مصممة لنمذجة الاستدلال طويل السلسلة وقدرات إدارة السياق للنماذج الكبيرة. تهدف هذه المجموعة إلى تدريب النماذج على ضغط السياق والاستدلال المستمر، مما يدعم مهام الاستدلال المعقدة متعددة الخطوات ضمن نطاق سياق محدود. وهي قابلة للتطبيق على نطاق واسع في سيناريوهات بحثية مثل نمذجة الاستدلال طويل السلسلة، وتدريب النماذج المحسّنة بالذاكرة، والتوليد الفعال.
الاستخدام عبر الإنترنت:https://go.hyper.ai/RwCkt
8. مجموعة بيانات تقييم قدرة تحليل المستندات في ParseBench
أصدر فريق LlamaIndex مجموعة بيانات تقييم قدرة ParseBench على تحليل المستندات في الفترة 2024-2025. تحتوي هذه المجموعة على ما يقارب 2000 صفحة تم التحقق منها وتصنيفها يدويًا، بالإضافة إلى 169011 قاعدة اختبار موزعة على خمسة أبعاد. وقد تم استخلاص هذه الصفحات من مستندات مؤسسية متاحة للعموم تغطي قطاعات التأمين والتمويل والحكومة وغيرها، وتشمل أنواعًا مختلفة من الصفحات، بما في ذلك ملفات PDF والصور الممسوحة ضوئيًا والصفحات التي تحتوي على جداول وتخطيطات صفحات. وتُقدم نتائج تحليل موحدة ومتوافقة مع التصنيفات البشرية لتقييم أداء النموذج في فهم البنية واستخراج المعلومات.
الاستخدام عبر الإنترنت:https://go.hyper.ai/FfFR6
9. مجموعة بيانات SOHL-multidish-yolo للكشف عن الأطعمة الهندية متعددة الأطباق.
مجموعة بيانات SOHL Multi-Dish YOLO هي مجموعة بيانات للتعرف على الأطعمة، مصممة خصيصًا لمهام الكشف عن الأجسام المتعددة في مجال رؤية الحاسوب. بُنيت هذه المجموعة استنادًا إلى مواصفات YOLOv8 للتعليقات التوضيحية، وتركز على مشكلة الكشف عن أطباق متعددة في مشاهد معقدة. تحتوي مجموعة البيانات على 377 صورة مُعلّمة بـ 377 تعليقًا توضيحيًا مطابقًا، تغطي 16 فئة من الأطعمة. تحتوي كل صورة على ما بين 2 إلى 6 أجسام غذائية، وتتميز بخصائص مثل التداخل، وتعدد الأحجام، والتخطيطات المعقدة.
الاستخدام عبر الإنترنت:https://go.hyper.ai/u5Lng
دروس تعليمية عامة مختارة
1. نموذج الصور الخام ERNIE-Image-Turbo
ERNIE-Image-Turbo هو نموذج مفتوح المصدر لتحويل النصوص إلى صور، تم إصداره بواسطة فريق Baidu ERNIE-Image في أبريل 2026. يتميز ERNIE-Image-Turbo بتتبع التعليمات المعقدة، وعرض النصوص، وإنشاء تخطيطات الملصقات، وإنشاء الصور المنظمة، وتغطية واسعة للأنماط، مما يجعله مناسبًا لسير عمل المحتوى الإبداعي مثل تصميم الملصقات، وإنشاء الرسوم التوضيحية، ورسم مفاهيم واجهة المستخدم.
تشغيل عبر الإنترنت:https://go.hyper.ai/hmKUg

2. تثبيت Qwen 3.6-27B بنقرة واحدة
يُعدّ Qwen3.6-27B نموذجًا متعدد الوسائط عالي الكثافة، يضم 27 مليار مُعامل، وقد طرحه فريق Tongyi Qianwen كمصدر مفتوح. يدعم هذا النموذج أنماط التفكير متعدد الوسائط وغير التفكير، محققًا أداءً متميزًا في برمجة الوكلاء، ومتفوقًا بذلك على سابقه، Qwen3.5-397B-A17B، وهو نموذج رائد مفتوح المصدر. وبفضل بنيته الكثيفة، يُمكن نشره دون الحاجة إلى توجيه MoE، مما يجعله خيارًا مثاليًا للمطورين الباحثين عن إمكانيات برمجة فائقة بطريقة عملية وقابلة للتطبيق على نطاق واسع.
تشغيل عبر الإنترنت:https://go.hyper.ai/GU9S2

3. SAM3.1: تتبع وتجزئة الفيديو متعدد الأجسام
SAM3.1 (نموذج تقسيم أي شيء 3.1) هو نظام مفتوح المفردات لتتبع وتقسيم الأجسام في الفيديو. يحقق هذا النموذج تتبعًا فعالًا للأجسام المتعددة في الفيديو من خلال تقنية تعدد إرسال الأجسام.
تشغيل عبر الإنترنت:https://go.hyper.ai/3e5qL

4. Qwen3.6-35B-A3B: أداة قوية لبرمجة الوكلاء الأذكياء.
في أبريل 2026، أصدر فريق Qwen نموذج الخبير الهجين متعدد الوسائط (MoE) Qwen3.6-35B-A3B. يحتوي هذا النموذج على 35 مليار مُعامل، ولكن يتم تفعيل 3 مليارات مُعامل فقط في كل عملية استدلال، مما يقلل بشكل كبير من تكاليف الاستدلال مع الحفاظ على الأداء العالي.
تشغيل عبر الإنترنت:https://go.hyper.ai/Gc7bp

5. بناء الشبكات العصبية من الصفر: دليل NumPy
يرشد هذا الدليل المستخدمين إلى بناء إطار عمل بسيط للشبكات العصبية من الصفر باستخدام مكتبة NumPy فقط، ويغطي بشكل شامل المفاهيم الأساسية بدءًا من الخلايا العصبية والأوزان والانتشار الأمامي وصولًا إلى الطبقات المخفية ووظائف التنشيط والخسارة. كما يساعد المستخدمين على فهم المبادئ الكامنة وراء بناء نماذج التعلم العميق، متجاوزًا مجرد استدعاء واجهات برمجة التطبيقات الخاصة بإطار العمل.
تشغيل عبر الإنترنت:https://go.hyper.ai/OmyS0
تفسير مقالة المجتمع
1. مؤتمر ICLR 2026 | انخفاض بمقدار 125 ضعفًا في المعلمات القابلة للتدريب لكل مهمة! تساعد طريقة Task Tokens الجديدة الذكاء المجسد على تحسين قدرته على التعامل مع المهام المعقدة.
اقترح فريق بحثي من معهد التخنيون - معهد إسرائيل للتكنولوجيا - طريقةً تُسمى "رموز المهام"، تُكيّف خوارزمية BFM بفعالية مع مهام محددة مع الحفاظ على مرونتها. وبالمقارنة مع الطرق الأساسية القياسية، تُقلل هذه الطريقة الجديدة عدد المعلمات القابلة للتدريب لكل مهمة بما يصل إلى 125 ضعفًا، وتُحسّن سرعة التقارب بما يصل إلى 6 أضعاف. كما تحقّق الباحثون من فعالية "رموز المهام" في مهام متنوعة، بما في ذلك سيناريوهات خارج نطاق التوزيع، وأثبتوا توافقها مع طرق التلميح الأخرى.
شاهد التقرير الكامل:https://go.hyper.ai/vs0C6
2. اقترحت جامعة تورنتو وآخرون dnaHNet، الذي يحسن سرعة الاستدلال بمقدار 3 مرات ويقلل التكلفة الحسابية لتعلم الجينوم بما يقرب من 4 مرات.
يقدم نموذج dnaHNet، الذي اقترحته جامعة تورنتو ومعهد Vector للذكاء الاصطناعي في كندا ومعهد Arc في الولايات المتحدة، نهجًا جديدًا لتحقيق توازن أفضل بين الجدوى الحسابية والدقة البيولوجية.
شاهد التقرير الكامل:https://go.hyper.ai/dRnYT
مقالات موسوعية شعبية
1. المهارات
2. الحقيقة الأساسية
3. دالة خسارة الثلاثية
4. شبكات كولموغوروف-أرنولد
5. دمج الرتب المتبادل
فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:
إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!
نراكم في الاسبوع القادم!
حول HyperAI
HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:
* يوفر نقاط تنزيل محلية معجلة لأكثر من 2100 مجموعة بيانات عامة
* يتضمن أكثر من 700 درس تعليمي كلاسيكي وشائع عبر الإنترنت
* تحليل أكثر من 300 دراسة حالة من أوراق بحثية حول الذكاء الاصطناعي للعلوم
* يدعم البحث عن أكثر من 700 مصطلح ذي صلة
* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين
قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:








