Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

VideoCanvas: إكمال الفيديو الموحّد من قطع مكانيّة زمنيّة عشوائية عبر التكييف السياقي

UniVideo: فهم موحد، إنتاج، وتحرير للفيديوهات































VideoCanvas: إكمال الفيديو الموحّد من قطع مكانيّة زمنيّة عشوائية عبر التكييف السياقي

UniVideo: فهم موحد، إنتاج، وتحرير للفيديوهات






























MemMamba: إعادة التفكير في أنماط الذاكرة في نموذج الفضاء الحالة
MM-HELIX: تعزيز الاستدلال التأملي متعدد الوسائط الطويل السلسلة من خلال منصة شاملة وتحسين سياسة هجينة متكيفة
PromptCoT 2.0: توسيع توليد التعليمات لاستدلال النماذج اللغوية الكبيرة
نموذج لغوي متخصص لاستخراج المعلومات من المستندات
OmniRetarget: توليد بيانات محفوظة التفاعل لحركة الإنسان الآلي بأكمل جسمه ومهام التلاعب والتفاعل مع المشهد
WildSpeech-Bench: تقييم النماذج اللغوية الصوتية النهائية في البيئة الطبيعية
تحرير التنشيطات الداخلية ذي الوعي بالرمز لتوافق النماذج اللغوية الكبيرة
البحث عن التعلم: توجيه ديناميكي حسب الرموز لنماذج الرؤية واللغة ذات الموارد المنخفضة
تعلم الوكيل من خلال الخبرة المبكرة
MATRIX: مصفوفة محاذاة التتبع للتفاعل في إنشاء مقاطع الفيديو
RLinf-VLA: إطار موحد وفعال لتدريب VLA+RL
شانكس: الاستماع والتفكير المتزامنين لنماذج اللغة الشفهية
Lumina-DiMOO: نموذج لغوي كبير تشتتية شمولية للإدراك والتكوين متعدد الوسائط
الوصول السريع إلى الوصول السريع: الاتصال الدلالي المباشر بين نماذج اللغة الكبيرة
Ming-UniVision: الفهم والتكوين المتكامل للصورة باستخدام مُفكّك رموز مستمر موحد
تقرير فاي-3: نموذج لغوي قوي يمكن تشغيله محليًا على هاتفك
تقرير فني لـ Qwen2.5
اكتشاف الخوارزميات العلمية بتعزيز AlphaEvolve بالبحث العميق
ConstraintLLM: إطار عصبي-رمزي لبرمجة القيود على مستوى الصناعة
توسيع سلسلة التفكير المدعومة بالكود والتعليمات لتحسين استنتاج النموذج
كودا: تشفير نموذج اللغة من خلال التكيّف بالانتشار
Fast-dLLM v2: LLM ذات توزيع كتلة فعّال
أقل هو أكثر: الاستدلال المتكرر مع الشبكات الصغيرة
Fathom-DeepResearch: فتح آفاق استرجاع المعلومات وتحليلها على المدى الطويل للنماذج اللغوية الصغيرة
TaTToo: أداة مبنية على التفكير PRM للتوسع في وقت الاختبار في التفكير الجدولي
الهياكل الهجينة لنماذج اللغة: تحليل منهجي ورؤى في التصميم
MITS: تحسين التفكير القائم على البحث الشجري للنماذج اللغوية الكبيرة من خلال المعلومات التبادلية النقطية
اختراق غير ملحوظ لنموذج لغوي كبير
VChain: سلسلة التفكير البصري للاستدلال في توليد الفيديو
التدريب اللاحق لنموذج الفيديو متعدد الوسائط الكبير: نظرة متعمقة في التفكير في الفيديو باستخدام النماذج متعددة الوسائط الكبيرة
MemMamba: إعادة التفكير في أنماط الذاكرة في نموذج الفضاء الحالة
MM-HELIX: تعزيز الاستدلال التأملي متعدد الوسائط الطويل السلسلة من خلال منصة شاملة وتحسين سياسة هجينة متكيفة
PromptCoT 2.0: توسيع توليد التعليمات لاستدلال النماذج اللغوية الكبيرة
نموذج لغوي متخصص لاستخراج المعلومات من المستندات
OmniRetarget: توليد بيانات محفوظة التفاعل لحركة الإنسان الآلي بأكمل جسمه ومهام التلاعب والتفاعل مع المشهد
WildSpeech-Bench: تقييم النماذج اللغوية الصوتية النهائية في البيئة الطبيعية
تحرير التنشيطات الداخلية ذي الوعي بالرمز لتوافق النماذج اللغوية الكبيرة
البحث عن التعلم: توجيه ديناميكي حسب الرموز لنماذج الرؤية واللغة ذات الموارد المنخفضة
تعلم الوكيل من خلال الخبرة المبكرة
MATRIX: مصفوفة محاذاة التتبع للتفاعل في إنشاء مقاطع الفيديو
RLinf-VLA: إطار موحد وفعال لتدريب VLA+RL
شانكس: الاستماع والتفكير المتزامنين لنماذج اللغة الشفهية
Lumina-DiMOO: نموذج لغوي كبير تشتتية شمولية للإدراك والتكوين متعدد الوسائط
الوصول السريع إلى الوصول السريع: الاتصال الدلالي المباشر بين نماذج اللغة الكبيرة
Ming-UniVision: الفهم والتكوين المتكامل للصورة باستخدام مُفكّك رموز مستمر موحد
تقرير فاي-3: نموذج لغوي قوي يمكن تشغيله محليًا على هاتفك
تقرير فني لـ Qwen2.5
اكتشاف الخوارزميات العلمية بتعزيز AlphaEvolve بالبحث العميق
ConstraintLLM: إطار عصبي-رمزي لبرمجة القيود على مستوى الصناعة
توسيع سلسلة التفكير المدعومة بالكود والتعليمات لتحسين استنتاج النموذج
كودا: تشفير نموذج اللغة من خلال التكيّف بالانتشار
Fast-dLLM v2: LLM ذات توزيع كتلة فعّال
أقل هو أكثر: الاستدلال المتكرر مع الشبكات الصغيرة
Fathom-DeepResearch: فتح آفاق استرجاع المعلومات وتحليلها على المدى الطويل للنماذج اللغوية الصغيرة
TaTToo: أداة مبنية على التفكير PRM للتوسع في وقت الاختبار في التفكير الجدولي
الهياكل الهجينة لنماذج اللغة: تحليل منهجي ورؤى في التصميم
MITS: تحسين التفكير القائم على البحث الشجري للنماذج اللغوية الكبيرة من خلال المعلومات التبادلية النقطية
اختراق غير ملحوظ لنموذج لغوي كبير
VChain: سلسلة التفكير البصري للاستدلال في توليد الفيديو
التدريب اللاحق لنموذج الفيديو متعدد الوسائط الكبير: نظرة متعمقة في التفكير في الفيديو باستخدام النماذج متعددة الوسائط الكبيرة