Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

RubricBench: محاذاة المعايير التي تولّدها النماذج مع المعايير البشرية

MMR-Life: تجميع مشاهد الحياة الواقعية للاستدلال متعدد الوسائط متعدد الصور































RubricBench: محاذاة المعايير التي تولّدها النماذج مع المعايير البشرية

MMR-Life: تجميع مشاهد الحياة الواقعية للاستدلال متعدد الوسائط متعدد الصور






























OpenAutoNLU: مكتبة مفتوحة المصدر للـ AutoML في معالجة اللغة الطبيعية
أوميني لوتاي: إنشاء رسوم متحركة متجهة من خلال رموز لوتاي المعتمدة على المعلمات
من المقياس إلى السرعة: التوسع المُعدِّل عند وقت الاختبار للتحرير الصوري
التعاون بين الـ Multi-agent من خلال استنتاج الـ co-player في السياق (in-context)
ACTIONENGINE: من الوكلاء التفاعليين إلى وكلاء GUI البرمجيين عبر ذاكرة State Machine
CiteAudit: لقد أشرتَ إليه، لكنك قرأتَه؟ معيار لتقييم المراجع العلمية في العصر الذي تهيمن عليه نماذج اللغة الكبيرة
البحث عن النمط يلتقي بالبحث عن المتوسط لتحقيق توليد سريع للفيديوهات الطويلة
وسيط CUDA: التعلم التفاعلي الوكيل على نطاق واسع لإنشاء نوى CUDA عالية الأداء
استُرجِع في الترجمة: خط أنابيب فعّال للترجمة التلقائية للمعايير والبيانات
تحسين الفهم المكاني في توليد الصور من خلال نمذجة المكافأة
dLLM: نمذجة اللغة بالتفتيت البسيط
وسيط LLM مُعزّز بالذاكرة استكشافي من خلال التحسين الهجين القائم على السياسة والغير سياسة
الخيال يساعد التفكير البصري، ولكن ليس بعد في الفضاء الخفي
أومني جايَا: نحو وكالات ذكاء اصطناعي متعددة الوسائط الأصلية
MobilityBench: معيار لتقييم وكلاء التخطيط للمسار في سيناريوهات التنقّل الواقعية
من الثقوب العمياء إلى المكاسب: التدريب التكراري الموجه بالتشخيص لنماذج كبيرة متعددة الوسائط
ثلاثية الاتساق كمبدأ محدد لنموذج العالم العام
GUI-Libra: تدريب وكلاء واجهة المستخدم الأصلية للتفكير والعمل باستخدام الإشراف المُدرك للإجراءات والتعلم القائم على التحقق الجزئي
SkyReels-V4: نموذج متعدد الوسائط لإنشاء الفيديو والصوت، وإعادة التعبئة، والتحرير
ARLArena: إطار موحد للتعلم التقييمي العامل المستقر
DreamID-Omni: إطار موحد لإنشاء صوتي-مرئي قابِل للتحكم يركّز على الإنسان
MolHIT: تقدم توليد الرسم البياني الجزيئي باستخدام نماذج التشتت المنفصل الهرمي
HyTRec: معمارية انتباه هجينة تأخذ بعين الاعتبار الزمن للترشيح التسلسلي للسلوكيات الطويلة
دريم: تقييم البحث العميق باستخدام مقاييس عاملية
LongCLI-Bench: معيار أولي ودراسة للبرمجة الواعية على مدى طويل في واجهات سطر الأوامر
PyVision-RL: تشكيل نماذج الرؤية الوكيلية المفتوحة من خلال التعلم المعزز
من الإدراك إلى الفعل: معيار تفاعلي للاستدلال البصري
مرتبِّب مُوجَّهٌ بالاستعلام وواعٍ بالذاكرة لمعالجة السياق الطويل
هندسة البيانات لتوسيع قدرات الواجهة النهائية للنماذج الكبيرة للغة
DSDR: تنظيم التنوّع ثنائي المقياس لاستكشاف التفكير في LLM
OpenAutoNLU: مكتبة مفتوحة المصدر للـ AutoML في معالجة اللغة الطبيعية
أوميني لوتاي: إنشاء رسوم متحركة متجهة من خلال رموز لوتاي المعتمدة على المعلمات
من المقياس إلى السرعة: التوسع المُعدِّل عند وقت الاختبار للتحرير الصوري
التعاون بين الـ Multi-agent من خلال استنتاج الـ co-player في السياق (in-context)
ACTIONENGINE: من الوكلاء التفاعليين إلى وكلاء GUI البرمجيين عبر ذاكرة State Machine
CiteAudit: لقد أشرتَ إليه، لكنك قرأتَه؟ معيار لتقييم المراجع العلمية في العصر الذي تهيمن عليه نماذج اللغة الكبيرة
البحث عن النمط يلتقي بالبحث عن المتوسط لتحقيق توليد سريع للفيديوهات الطويلة
وسيط CUDA: التعلم التفاعلي الوكيل على نطاق واسع لإنشاء نوى CUDA عالية الأداء
استُرجِع في الترجمة: خط أنابيب فعّال للترجمة التلقائية للمعايير والبيانات
تحسين الفهم المكاني في توليد الصور من خلال نمذجة المكافأة
dLLM: نمذجة اللغة بالتفتيت البسيط
وسيط LLM مُعزّز بالذاكرة استكشافي من خلال التحسين الهجين القائم على السياسة والغير سياسة
الخيال يساعد التفكير البصري، ولكن ليس بعد في الفضاء الخفي
أومني جايَا: نحو وكالات ذكاء اصطناعي متعددة الوسائط الأصلية
MobilityBench: معيار لتقييم وكلاء التخطيط للمسار في سيناريوهات التنقّل الواقعية
من الثقوب العمياء إلى المكاسب: التدريب التكراري الموجه بالتشخيص لنماذج كبيرة متعددة الوسائط
ثلاثية الاتساق كمبدأ محدد لنموذج العالم العام
GUI-Libra: تدريب وكلاء واجهة المستخدم الأصلية للتفكير والعمل باستخدام الإشراف المُدرك للإجراءات والتعلم القائم على التحقق الجزئي
SkyReels-V4: نموذج متعدد الوسائط لإنشاء الفيديو والصوت، وإعادة التعبئة، والتحرير
ARLArena: إطار موحد للتعلم التقييمي العامل المستقر
DreamID-Omni: إطار موحد لإنشاء صوتي-مرئي قابِل للتحكم يركّز على الإنسان
MolHIT: تقدم توليد الرسم البياني الجزيئي باستخدام نماذج التشتت المنفصل الهرمي
HyTRec: معمارية انتباه هجينة تأخذ بعين الاعتبار الزمن للترشيح التسلسلي للسلوكيات الطويلة
دريم: تقييم البحث العميق باستخدام مقاييس عاملية
LongCLI-Bench: معيار أولي ودراسة للبرمجة الواعية على مدى طويل في واجهات سطر الأوامر
PyVision-RL: تشكيل نماذج الرؤية الوكيلية المفتوحة من خلال التعلم المعزز
من الإدراك إلى الفعل: معيار تفاعلي للاستدلال البصري
مرتبِّب مُوجَّهٌ بالاستعلام وواعٍ بالذاكرة لمعالجة السياق الطويل
هندسة البيانات لتوسيع قدرات الواجهة النهائية للنماذج الكبيرة للغة
DSDR: تنظيم التنوّع ثنائي المقياس لاستكشاف التفكير في LLM