HyperAIHyperAI

Command Palette

Search for a command to run...

منذ شهر واحد

Lumina-DiMOO: نموذج لغوي كبير تشتتية شمولية للإدراك والتكوين متعدد الوسائط

Lumina-DiMOO: نموذج لغوي كبير تشتتية شمولية للإدراك والتكوين متعدد الوسائط

الملخص

نُقدّم نموذج Lumina-DiMOO، وهو نموذج أساسي مفتوح المصدر يُعدّ لإنجاز التوليد والفهم متعدد الوسائط بسلاسة. يميّز Lumina-DiMOO نفسه عن النماذج الموحّدة السابقة من خلال استخدام نموذج تشتت كامل التجزئة (fully discrete diffusion modeling) لمعالجة المدخلات والنتائج عبر مختلف الوسائط. وتُعدّ هذه المقاربة المبتكرة مُمكّنةً لـLumina-DiMOO من تحقيق كفاءة أعلى في العينة مقارنةً بالمناهج السابقة القائمة على التوليد التسلسلي (autoregressive - AR) أو المزيج بين التوليد التسلسلي ونموذج التشتت (hybrid AR-Diffusion)، كما تُمكّنه من دعم مهام متعددة الوسائط واسعة النطاق، بما في ذلك توليد الصور من النص، وتوليد الصور من الصور (مثل تعديل الصور، والتوليد القائم على الموضوع، وتعبئة الصور)، فضلاً عن فهم الصور. وحقق Lumina-DiMOO أداءً متميزًا على عدة معايير، متفوقًا على النماذج الموحّدة متعددة الوسائط المفتوحة المصدر الحالية. ولتشجيع التقدّم المستقبلي في أبحاث الوسائط المتعددة ونماذج التشتت التجزئية، نُطلق كود النموذج ونُشَرّح نقاط التحقق (checkpoints) للمجتمع العلمي. صفحة المشروع: https://synbol.github.io/Lumina-DiMOO.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
Lumina-DiMOO: نموذج لغوي كبير تشتتية شمولية للإدراك والتكوين متعدد الوسائط | الأوراق البحثية | HyperAI