تقوم شركة ByteDance بفتح مصدر Lance، وهو نموذج 3B يشمل الفهم والإنشاء والتحرير؛ وتقترح جامعة سنغافورة الوطنية مجموعة بيانات ViMU: التي تغطي 588 مقطع فيديو والإجابة على الأسئلة غير اللفظية.

منذ 2 أشهر

يُعدّ لانس، الذي أطلقته شركة بايت دانس عام 2026، نموذجًا موحدًا متعدد الوسائط. وبفضل تصميمه القائم على معلمات النشاط 3B، يُمكنه أداء مهام فهم الصور والفيديوهات وإنشائها وتحريرها في آنٍ واحد ضمن إطار عمل واحد. يحقق هذا النموذج مشاركة القدرات بين مهام النصوص والصور والفيديوهات من خلال تمثيل موحد متعدد الوسائط وتدريب تعاوني متعدد المهام. يعتمد جوهره على بنية خبير هجينة ثنائية المسار (MoE) وتشفير الموضع الدوراني المُدرك للوسائط (MaPE)، مما يُحقق تعلمًا موحدًا للسياق على تسلسلات متعددة الوسائط متداخلة مشتركة، مع فصل مسارات القدرات الخاصة بالفهم والإنشاء بذكاء. وبالاقتران مع استراتيجية تدريب متعددة المهام على مراحل، يتفوق لانس بشكل ملحوظ على النماذج الموحدة مفتوحة المصدر الحالية من حيث جودة إنشاء الصور والفيديوهات، مع الحفاظ على قدرات ممتازة في فهم الدلالات متعددة الوسائط.

يعرض موقع HyperAI الإلكتروني الآن "Lance: Unifying Multimodal Understanding, Generation, and Editing Models"، لذا تفضلوا بتجربته!

الاستخدام عبر الإنترنت:https://go.hyper.ai/Okkmw

نرحب بكم لزيارة موقعنا الإلكتروني الرسمي لمزيد من المعلومات:

https://hyper.ai

نظرة سريعة على تحديثات الموقع الرسمي لشركة hyper.ai من 23 مايو إلى 29 مايو:

* مجموعات البيانات العامة عالية الجودة: 3

* مجموعة مختارة من الدروس التعليمية عالية الجودة: 3

* تفسير مقالة المجتمع: 3 مقالات

* إدخالات الموسوعة الشعبية: 5

قم بزيارة الموقع الرسمي:هايبر.اي

مجموعات البيانات العامة المختارة

1. مجموعة بيانات فهم استعارات الفيديو ViMU

ViMU هي مجموعة بيانات مرجعية لفهم استعارات الفيديو تم إصدارها من قبل جامعة سنغافورة الوطنية في عام 2026. وتهدف إلى تقييم قدرة النماذج الكبيرة متعددة الوسائط على فهم المعاني الدلالية العميقة لاستعارات الفيديو.

الاستخدام عبر الإنترنت:https://go.hyper.ai/0DIpe

2. مجموعة بيانات أمراض أوراق الأرز

مجموعة بيانات الكشف عن أمراض أوراق الأرز هي مجموعة بيانات صور لأوراق الأرز مصممة خصيصًا لمهام الكشف عن الأهداف في الزراعة الدقيقة. تُستخدم هذه المجموعة على نطاق واسع في تطبيقات مثل تدريب نموذج YOLO، والكشف عن الأمراض الزراعية، ونشر تقنيات الرؤية الطرفية، وإدارة زراعة الأرز الذكية. تحتوي هذه المجموعة على 8665 صورة لأوراق الأرز، تغطي 9 فئات، تشمل أوراق الأرز السليمة و8 أمراض شائعة: اللفحة البكتيرية للأوراق، والبقعة البنية، وتلف أوراق الأرز الناتج عن اللف، ولفحة الأرز، واحتراق الأوراق، وتفحم الأوراق، والبقعة البنية الضيقة، ولفحة العنق.

الاستخدام عبر الإنترنت:https://go.hyper.ai/IXOlY

3. مجموعة بيانات التصوير بالرنين المغناطيسي لأمراض التنكس العصبي في الدماغ

مجموعة بيانات التصوير بالرنين المغناطيسي لأمراض الدماغ التنكسية العصبية هي مجموعة بيانات مصممة خصيصًا لأبحاث وتحليل الصور الطبية لأمراض الدماغ التنكسية العصبية. تُستخدم هذه المجموعة على نطاق واسع في مجالات بحثية مثل تصنيف الأمراض، والتعرف على الصور الطبية، وتدريب نماذج التعلم العميق. تحتوي مجموعة البيانات على 2846 صورة رنين مغناطيسي للدماغ بدقة 512 × 512 بكسل، مُنظمة وفقًا لوزنين تصويريين وأربع فئات رئيسية.

الاستخدام عبر الإنترنت:https://go.hyper.ai/VpFoh

دروس تعليمية عامة مختارة

1. لانس: نموذج موحد لفهم البيانات متعددة الوسائط وإنشائها وتحريرها.

يُعدّ لانس، الذي أطلقته شركة بايت دانس عام 2026، نموذجًا موحدًا متعدد الوسائط أصليًا بقدرة 3 مليارات، مصممًا لمهام مثل فهم الصور والفيديوهات، وتحويل النصوص إلى صور، وتحويل النصوص إلى فيديوهات، وتحرير الصور والفيديوهات. تكمن الميزة الرئيسية للانس في معالجته لعمليات الفهم والإنشاء والتحرير ضمن إطار نموذج واحد، مما يُمكّن مهام النصوص والصور والفيديوهات من مشاركة تمثيل موحد متعدد الوسائط. يستطيع لانس إنشاء صور أو فيديوهات من النصوص، وإجراء تحرير مرئي من خلال دمج الصور والفيديوهات المدخلة مع التعليمات النصية، بالإضافة إلى الإجابة على الأسئلة، والوصف، والاستدلال على الصور والفيديوهات.

تشغيل عبر الإنترنت:https://go.hyper.ai/Okkmw

2. نموذج العالم HY-World-2.0

HY-World-2.0 هو إطار عمل لنموذج العالم متعدد الوسائط أطلقته شركة Tencent في عام 2026. على عكس نماذج العالم التي تولد مقاطع فيديو بكسل فقط (مثل Genie 3 و Cosmos)، فإن HY-World-2.0 يولد أصولًا ثلاثية الأبعاد واقعية (شبكة/3DGS) بشكل مباشر، وهي قابلة للتحرير، ودائمة، ويمكن استيرادها مباشرة إلى محركات الألعاب مثل Blender و Unity و Unreal Engine.

تشغيل عبر الإنترنت:https://go.hyper.ai/ZQpHM

3. AutoFigure: نظام قائم على LLM لإنشاء الرسوم التوضيحية تلقائيًا للأوراق الأكاديمية.

AutoFigure هو نظام ذكي لتوليد الرسوم التوضيحية الأكاديمية، طوّره فريق ResearchAI في جامعة ويستليك ونُشر في مؤتمر ICLR 2026. يستخدم هذا النظام نموذجًا لغويًا ضخمًا (LM) من خلال آلية تحسين تكرارية لتوليد رسوم توضيحية علمية عالية الجودة تلقائيًا، تُلبي معايير النشر، انطلاقًا من النصوص الوصفية أو الأبحاث العلمية. يدعم النظام كلاً من رسومات SVG المتجهة وmxGraph XML (متوافق تمامًا مع draw.io).

تشغيل عبر الإنترنت:https://go.hyper.ai/ZrWS4

تفسير مقالة المجتمع

1. CVEvolve، وهي خوارزمية لمعالجة الصور العلمية ذاتية الاكتشاف بدون كتابة أي كود، اقترحها مختبر أرجون الوطني، تمتلك قدرات كاملة تشمل البرمجة والتحقق الذاتي من النتائج وتحسين الاستراتيجية.

قام فريق بحثي في مختبر أرغون الوطني (ANL) بالولايات المتحدة بتطوير إطار عمل CVEvolve، وهو إطار عمل آلي بدون كتابة أي كود، وذلك بعد تحليل منهجي للأعمال السابقة القائمة على الذكاء الاصطناعي في مجال الأتمتة. صُمم هذا الإطار لاكتشاف الخوارزميات اللازمة لمعالجة البيانات العلمية. يتميز الإطار بمرونة عالية، إذ لا يتطلب بنية مشكلة محددة مسبقًا أو قوالب عمليات ثابتة. كما يُمكنه تحقيق ربط متكامل بين عناصر مختلفة، مثل الكود والبيانات ومقاييس التقييم وسجلات الاسترجاع ونتائج التصور، مما يدعم تطوير خوارزميات قابلة للتنفيذ في مجالات رؤية الحاسوب ومعالجة الصور وغيرها.

شاهد التقرير الكامل:https://go.hyper.ai/UBS5q

2. في غضون 30 دقيقة فقط، نجح العامل البيولوجي متعدد العوامل روبن في دمج 550 ورقة بحثية، مما أدى إلى إنشاء حلقة بحثية مستقلة وتحديد العلاجات المرشحة لمرض التنكس البقعي المرتبط بالعمر.

اقترح فريق مشترك من شركة FutureHouse في سان فرانسيسكو، وجامعة أكسفورد، وجامعة فوردهام، نظام Robin البيولوجي متعدد العوامل. يُعد هذا النظام أول نظام ذكي في مجال الطب الحيوي يدمج في آنٍ واحد قدرات توليد الفرضيات العلمية وتحليل البيانات التجريبية، مما يحقق سير عمل متواصلًا ومغلق الحلقة.

شاهد التقرير الكامل:https://go.hyper.ai/KnYpQ

3. ابتكر العلماء بشكل مستقل مواد جديدة من خلال الهندسة العكسية للمواد المحتوية على الغاليوم باستخدام إطار عمل التحسين البايزي. وتُظهر نتائج التحسين تفرداً وابتكاراً.

اقترح فريق بحثي بقيادة جامعة فليندرز بالتعاون مع جامعة خليفة في الإمارات العربية المتحدة إطار عمل لتحسين بايزي موجه بالتعلم الآلي، يُمكّن من التصميم العكسي لمركبات الغاليوم ذات الخصائص الإلكترونية المحددة مسبقًا مع الحفاظ على سلامة التركيب الكيميائي. تُظهر النتائج التحليلية بعد التحسين أن المادة المُولّدة تتميز بتفردها وحداثتها مقارنةً ببيانات التدريب، وأن فعالية تقنية SMACT قد تحسنت بشكل ملحوظ ضمن نطاق فجوة الطاقة 1.5-2.5 إلكترون فولت.

شاهد التقرير الكامل:https://go.hyper.ai/kXS7f

مقالات موسوعية شعبية

1. الشبكات الفائقة

2. مصفوفة الارتباك

3. الهندسة الفورية

4. التعلم أثناء النشر

5. دمج الرتب المتبادل

فيما يلي مئات المصطلحات المتعلقة بالذكاء الاصطناعي التي تم تجميعها لمساعدتك على فهم "الذكاء الاصطناعي" هنا:

https://go.hyper.ai/wiki

إن ما ورد أعلاه هو كل محتوى اختيار المحرر لهذا الأسبوع. إذا كان لديك موارد تريد تضمينها على الموقع الرسمي لـ hyper.ai، فنحن نرحب بك أيضًا لترك رسالة أو إرسال مقال لإخبارنا بذلك!

نراكم في الاسبوع القادم!

حول HyperAI

HyperAI (hyper.ai) هي شركة رائدة في مجال الذكاء الاصطناعي والحوسبة عالية الأداء في الصين.نحن ملتزمون بأن نصبح البنية التحتية في مجال علوم البيانات في الصين وتوفير موارد عامة غنية وعالية الجودة للمطورين المحليين. حتى الآن، لدينا:

* يوفر نقاط تنزيل محلية معجلة لأكثر من 2100 مجموعة بيانات عامة

* يتضمن أكثر من 700 درس تعليمي كلاسيكي وشائع عبر الإنترنت

* تحليل أكثر من 300 دراسة حالة من أوراق بحثية حول الذكاء الاصطناعي للعلوم

* يدعم البحث عن أكثر من 700 مصطلح ذي صلة

* استضافة أول وثائق كاملة حول Apache TVM باللغة الصينية في الصين

قم بزيارة الموقع الرسمي لبدء رحلة التعلم الخاصة بك:

https://hyper.ai