Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

SemanticMoments: تشابه الحركة دون تدريب من خلال ميزات اللحظة الثالثة

RLinf-Co: التدريب التعاوني بين المحاكاة والواقع القائم على التعلم بالتعزيز لنماذج VLA































SemanticMoments: تشابه الحركة دون تدريب من خلال ميزات اللحظة الثالثة

RLinf-Co: التدريب التعاوني بين المحاكاة والواقع القائم على التعلم بالتعزيز لنماذج VLA






























ABot-M0: نموذج أساسي لرؤية الآلة للتفاعل الروبوتى باستخدام تعلّم متعدّد الإجراءات
ما الذي تُحسّنُه التعلّم المعزّز (RL) في التفكير البصري؟ تحليل على نمط فرانكشتاين
ميدكسياوهي: وصفة شاملة لبناء موديلات LLM الطبية
التكيف دون تكبير: التقطيع من المنطقة إلى الصورة للاستشعار متعدد الوسائط الدقيق
القليل كافٍ: توليد بيانات متنوعة في فضاء الميزات لـ LLMs
GigaBrain-0.5M*: نموذج بصري لغوي يتعلم من التعلم المعزز القائم على نموذج العالم
MOSS-Audio-Tokenizer: توسيع مُفكّك الصوت لنموذج أساسي مستقبلي للصوت
التعلم وراء المُدرّس: التوليد التكيفي المُتعمّق على السياسة مع الاستقراء المكافئ
ديب جين 1.0: نموذج متعدد الوسائط موحد خفيف الوزن للتقدم في توليد الصور وتحريرها
Composition-RL: اصنع أسئلتك القابلة للتحقق لتعلم التقويم للنماذج اللغوية الكبيرة
الشيطان وراء مولت بوك: السلامة من أنتروبيك تختفي دائمًا في مجتمعات الذكاء الاصطناعي ذات التطور الذاتي
إلى البحث الرياضي المستقل
متى يتم التذكّر، ومتى يتوقف: الذاكرة المتكرّرة ذات البوابة للاستدلال بسياق طويل
ASA: التوجيه النشطي للتكيف في مجال استدعاء الأدوات
PhyCritic: نماذج ناقد متعددة الوسائط للذكاء الاصطناعي الفيزيائي
GENIUS: مجموعة تقييم الذكاء السائل التوليدي
الخطوة 3.5 فلش: فتح ذكاء على مستوى الحدود المفتوحة بـ 11B من المعاملات النشطة
World-VLA-Loop: التعلم المغلق الدائرة لنموذج عالم الفيديو وسياسة VLA
إلى بحوث الرياضيات المستقلة
نموذج العالم الوكيل: بيئات توليدية لا نهائية للتعلم المعزز الوكيلي
P1-VL: ج ponting بين الإدراك البصري والتفكير العلمي في مسابقات الفيزياء الأوليمبية
سلسلة العقلية: الاستدلال باستخدام أنماط معرفية متعددة التكيف
تقرير فني حول UI-Venus-1.5
Code2World: نموذج عالم واجهة رسومية مُولد عبر كود قابل للعرض
أوبوس: نحو اختيار بيانات فعّال ومقنن في تدريب النماذج اللغوية الكبيرة في كل تكرار
BagelVLA: تحسين التلاعب بفترة طويلة من خلال التوليد المتناوب للرؤية واللغة والفعل
THINGS-data: مجموعة بيانات متعددة الوسائط واسعة النطاق لاستقصاء تمثيلات الأشياء في الدماغ البشري والسلوك
تنبؤات دقيقة بالتفاعلات الجزيئية الحيوية الجديدة باستخدام IsoDDE
SKILLRL: تطوير Agents عبر Reinforcement Learning معزز بالمهارات بشكل تكراري
LLaDA2.1: تسريع التشتت النصي من خلال تعديل الرموز (Tokens)
ABot-M0: نموذج أساسي لرؤية الآلة للتفاعل الروبوتى باستخدام تعلّم متعدّد الإجراءات
ما الذي تُحسّنُه التعلّم المعزّز (RL) في التفكير البصري؟ تحليل على نمط فرانكشتاين
ميدكسياوهي: وصفة شاملة لبناء موديلات LLM الطبية
التكيف دون تكبير: التقطيع من المنطقة إلى الصورة للاستشعار متعدد الوسائط الدقيق
القليل كافٍ: توليد بيانات متنوعة في فضاء الميزات لـ LLMs
GigaBrain-0.5M*: نموذج بصري لغوي يتعلم من التعلم المعزز القائم على نموذج العالم
MOSS-Audio-Tokenizer: توسيع مُفكّك الصوت لنموذج أساسي مستقبلي للصوت
التعلم وراء المُدرّس: التوليد التكيفي المُتعمّق على السياسة مع الاستقراء المكافئ
ديب جين 1.0: نموذج متعدد الوسائط موحد خفيف الوزن للتقدم في توليد الصور وتحريرها
Composition-RL: اصنع أسئلتك القابلة للتحقق لتعلم التقويم للنماذج اللغوية الكبيرة
الشيطان وراء مولت بوك: السلامة من أنتروبيك تختفي دائمًا في مجتمعات الذكاء الاصطناعي ذات التطور الذاتي
إلى البحث الرياضي المستقل
متى يتم التذكّر، ومتى يتوقف: الذاكرة المتكرّرة ذات البوابة للاستدلال بسياق طويل
ASA: التوجيه النشطي للتكيف في مجال استدعاء الأدوات
PhyCritic: نماذج ناقد متعددة الوسائط للذكاء الاصطناعي الفيزيائي
GENIUS: مجموعة تقييم الذكاء السائل التوليدي
الخطوة 3.5 فلش: فتح ذكاء على مستوى الحدود المفتوحة بـ 11B من المعاملات النشطة
World-VLA-Loop: التعلم المغلق الدائرة لنموذج عالم الفيديو وسياسة VLA
إلى بحوث الرياضيات المستقلة
نموذج العالم الوكيل: بيئات توليدية لا نهائية للتعلم المعزز الوكيلي
P1-VL: ج ponting بين الإدراك البصري والتفكير العلمي في مسابقات الفيزياء الأوليمبية
سلسلة العقلية: الاستدلال باستخدام أنماط معرفية متعددة التكيف
تقرير فني حول UI-Venus-1.5
Code2World: نموذج عالم واجهة رسومية مُولد عبر كود قابل للعرض
أوبوس: نحو اختيار بيانات فعّال ومقنن في تدريب النماذج اللغوية الكبيرة في كل تكرار
BagelVLA: تحسين التلاعب بفترة طويلة من خلال التوليد المتناوب للرؤية واللغة والفعل
THINGS-data: مجموعة بيانات متعددة الوسائط واسعة النطاق لاستقصاء تمثيلات الأشياء في الدماغ البشري والسلوك
تنبؤات دقيقة بالتفاعلات الجزيئية الحيوية الجديدة باستخدام IsoDDE
SKILLRL: تطوير Agents عبر Reinforcement Learning معزز بالمهارات بشكل تكراري
LLaDA2.1: تسريع التشتت النصي من خلال تعديل الرموز (Tokens)