Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

SPIRAL: اللعب الذاتي في الألعاب ذات المجموع الصفر يشجع على التفكير من خلال التعلم التعزيزي متعدد الوكلاء ومتعدد الدورات

التفكير المكافأة بالمستمع في نماذج اللغة والصورة المرئية للاختيارات الصورية































SPIRAL: اللعب الذاتي في الألعاب ذات المجموع الصفر يشجع على التفكير من خلال التعلم التعزيزي متعدد الوكلاء ومتعدد الدورات

التفكير المكافأة بالمستمع في نماذج اللغة والصورة المرئية للاختيارات الصورية






























خطاط: تخصيص صورة نص حرة
VMoBA: مزيج انتباه الكتل لنموذج الفيديو التفاضلي
SMMILE: معيار محرك من الخبراء للتعلم السياقي متعدد الوسائط في المجال الطبي
القياس القياسي الآلي لسرعة تشغيل نماذج اللغة العميقة: إعادة إنتاج تحسينات NanoGPT
شكل-للحركة: تحرير الفيديو بدقة واتساق باستخدام نموذج ثلاثي الأبعاد
من المثالي إلى الحقيقي: التنبؤ الكثيف الموحد والفعال من حيث البيانات للسيناريوهات الحقيقية
ShotBench: فهم سينمائي على مستوى الخبراء في نماذج الرؤية واللغة
XVerse: التحكم المتسق في الهوية والخصائص الدلالية لعدة مواضيع من خلال تعديل DiT
تصميم الأجسام المضادة بدون تدريب مسبق في صفيحة ذات 24 بئرة
KinFormer: نموذج رياضي ديناميكي قابل للتعميم لحركية التفاعلات العضوية الكاتالítica
MiCo: التباين متعدد الصور للتفكير البصري التعزيزي
تحسين التفضيلات الدقيقة يحسن الاستدلال المكاني في نماذج اللغة المرئية والمعرفية
ARK: إطار مفتوح المصدر مستند إلى بايثون لتعلم الروبوتات
بانغو برو موإي: خليط من الخبراء المجموعين لتحقيق الكفاءة والندرة
LLaVA-مقص: ضغط الرموز باستخدام المكونات المرتبطة معانيًا لـ النماذج اللغوية الكبيرة للفيديو
BlenderFusion: التحرير البصري المُرتكز على ثلاثية الأبعاد والتركيب التوليدي
UniMate: نموذج موحد لتصميم المواد الميتا-ميكانيكية، التنبؤ بخصائصها، وتأكيد حالتها
تعلم تخطي الطبقات الوسطى للمتحولات
SAM4D: تقسيم أي شيء في تدفقات الكاميرا وليدار
أين يمكن العثور على الفهم في التدريب المسبق للنماذج اللغوية الكبيرة؟ مراقبة الانتقال من الحفظ إلى التعميم دون اختبار
FineWeb2: أنبوب واحد لتوسيع نطاق كل اللغات -- تكييف معالجة بيانات التدريب الأولي لكل لغة
MADrive: نمذجة مشهد القيادة المُعزز بالذاكرة
FaSTA^*: وكيل مسار سريع-بطيء مع تعدين الروتينات الفرعية لتحرير الصور المتعدد الدورات بكفاءة
Mind2Web 2: تقييم البحث الوكيل بوكيل كقاضٍ
WorldVLA: نحو نموذج عالمي تلقائي للسلوك
إعادة الترميز: تحديث معرفة واجهة برمجة التطبيقات باستخدام التعلم التعزيزي
عندما تعطيك الحياة عينات: فوائد زيادة حجم الاستدلال الحاسوبي للنماذج اللغوية متعددة اللغات
HiWave: إنشاء صور ذات دقة عالية بدون تدريب عبر عينات التفتيت الموجي
DualTHOR: منصة محاكاة روبوتية ثنائية الذراع لالتخطيط مع الوعي بالحالات الطارئة
MMSearch-R1: تحفيز النماذج اللغوية الصغيرة للبحث
خطاط: تخصيص صورة نص حرة
VMoBA: مزيج انتباه الكتل لنموذج الفيديو التفاضلي
SMMILE: معيار محرك من الخبراء للتعلم السياقي متعدد الوسائط في المجال الطبي
القياس القياسي الآلي لسرعة تشغيل نماذج اللغة العميقة: إعادة إنتاج تحسينات NanoGPT
شكل-للحركة: تحرير الفيديو بدقة واتساق باستخدام نموذج ثلاثي الأبعاد
من المثالي إلى الحقيقي: التنبؤ الكثيف الموحد والفعال من حيث البيانات للسيناريوهات الحقيقية
ShotBench: فهم سينمائي على مستوى الخبراء في نماذج الرؤية واللغة
XVerse: التحكم المتسق في الهوية والخصائص الدلالية لعدة مواضيع من خلال تعديل DiT
تصميم الأجسام المضادة بدون تدريب مسبق في صفيحة ذات 24 بئرة
KinFormer: نموذج رياضي ديناميكي قابل للتعميم لحركية التفاعلات العضوية الكاتالítica
MiCo: التباين متعدد الصور للتفكير البصري التعزيزي
تحسين التفضيلات الدقيقة يحسن الاستدلال المكاني في نماذج اللغة المرئية والمعرفية
ARK: إطار مفتوح المصدر مستند إلى بايثون لتعلم الروبوتات
بانغو برو موإي: خليط من الخبراء المجموعين لتحقيق الكفاءة والندرة
LLaVA-مقص: ضغط الرموز باستخدام المكونات المرتبطة معانيًا لـ النماذج اللغوية الكبيرة للفيديو
BlenderFusion: التحرير البصري المُرتكز على ثلاثية الأبعاد والتركيب التوليدي
UniMate: نموذج موحد لتصميم المواد الميتا-ميكانيكية، التنبؤ بخصائصها، وتأكيد حالتها
تعلم تخطي الطبقات الوسطى للمتحولات
SAM4D: تقسيم أي شيء في تدفقات الكاميرا وليدار
أين يمكن العثور على الفهم في التدريب المسبق للنماذج اللغوية الكبيرة؟ مراقبة الانتقال من الحفظ إلى التعميم دون اختبار
FineWeb2: أنبوب واحد لتوسيع نطاق كل اللغات -- تكييف معالجة بيانات التدريب الأولي لكل لغة
MADrive: نمذجة مشهد القيادة المُعزز بالذاكرة
FaSTA^*: وكيل مسار سريع-بطيء مع تعدين الروتينات الفرعية لتحرير الصور المتعدد الدورات بكفاءة
Mind2Web 2: تقييم البحث الوكيل بوكيل كقاضٍ
WorldVLA: نحو نموذج عالمي تلقائي للسلوك
إعادة الترميز: تحديث معرفة واجهة برمجة التطبيقات باستخدام التعلم التعزيزي
عندما تعطيك الحياة عينات: فوائد زيادة حجم الاستدلال الحاسوبي للنماذج اللغوية متعددة اللغات
HiWave: إنشاء صور ذات دقة عالية بدون تدريب عبر عينات التفتيت الموجي
DualTHOR: منصة محاكاة روبوتية ثنائية الذراع لالتخطيط مع الوعي بالحالات الطارئة
MMSearch-R1: تحفيز النماذج اللغوية الصغيرة للبحث