Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

تخفيف المكافآت النادرة من خلال نمذجة تأثيرات العينة الخطوة بخطوة والطويلة الأجل في GRPO القائمة على التدفق

Recurrent-Depth VLA: التوسع الضمني في حسابات الوقت الاختباري لنموذج الرؤية واللغة والفعل من خلال الاستدلال التكراري في الفضاء المخفي































تخفيف المكافآت النادرة من خلال نمذجة تأثيرات العينة الخطوة بخطوة والطويلة الأجل في GRPO القائمة على التدفق

Recurrent-Depth VLA: التوسع الضمني في حسابات الوقت الاختباري لنموذج الرؤية واللغة والفعل من خلال الاستدلال التكراري في الفضاء المخفي






























كوانتا ألفا: إطار تطوري لاستخراج ألفا يُقوده LLM
نمط تدريب مُوجَّه بالفجوة الوظيفية لمحاذاة الفراغات الفرعية للنماذج الكبيرة للغة متعددة الوسائط
MOVA: نحو توليد فيديو صوتي قابل للتوسع والمتزامن
MemoryLLM: ذاكرة تغذية أمامية قابلة للتشغيل الفوري وقابلة للتفسير لمحولات
DreamDojo: نموذج عالم روبوت متعدد الاستخدامات مستمد من مقاطع فيديو بشرية على نطاق واسع
F-GRPO: لا تسمح لسياسة التعلم بالتعلّم من الأشياء الواضحة ونسيان النادر
MSign: مُحسِّن يمنع عدم الاستقرار التدريبي في نماذج اللغة الكبيرة من خلال استعادة الرتبة المستقرة
AudioSAE: نحو فهم نماذج معالجة الصوت باستخدام المُشفّرات التلقائية النادرة
على ديناميكية الإنتروبيا في التحسين التدريجي للنماذج اللغوية الكبيرة
أوديسيا أرينا: تقييم النماذج اللغوية الكبيرة للتفاعلات الطويلة الأجل، والنشطة، والاستنتاجية
بايتشوان-م3: نمذجة الاستفسار السريري لاتخاذ قرارات طبية موثوقة
النمذجة التوليدية عبر الانزلاق
AlphaEdit: تحرير المعرفة المُقيَّد بمجال الصفر للنماذج اللغوية
التعلم للاستنتاج في 13 معلمة
DFlash: التبادل الكتلي للتكهن بالفك الشفاف السريع
إجبار السياق: توليد فيديو تلقائي متسلسل متسق مع سياق طويل
MemSkill: تعلّم وتطور المهارات الذاكرةية للوكلاء الذاتية التطوّر
تحسين سياسة التسلسل غير المُحَيَّز طوله: كشف التغير في طول الاستجابة وتحكم فيه في التعلم بالتعزيز القائم على التقييم
سبايدر-سنس: الكشف الداخلي عن المخاطر لدفاع الوكيل الفعّال مع التصفية التكيفية الهرمية
CAR-bench: تقييم الاتساق والوعي بالحدود لوكالات LLM في ظل عدم اليقين في العالم الحقيقي
التعلم المتدفق من نوع Sequence-to-Sequence مع نمذجة التدفقات المتأخرة (Delayed Streams)
Kiss3DGen: إعادة توظيف نماذج Image Diffusion لإنتاج 3D Asset
Conformer ذو الحالة (Stateful) مع استدلال قائم على الـ Cache لعملية التعرف التلقائي على الكلام (Automatic Speech Recognition) بنظام التدفق (Streaming)
Latents مهيكلة أصلية ومدمجة لتوليد 3D
نماذج اللغة الصوتية المستمرة (Continuous Audio Language Models)
تطوير Agent تشخيصي تفاعلي في بيئة سريرية افتراضية
WeDLM: مواءمة نماذج اللغة القائمة على الانتشار مع الانتباه السببي القياسي لاستخلاص سريع
توربو ديفوسيون: تسريع نماذج التفتيت الفيديو بنسبة 100 إلى 200 مرة
HunyuanVideo-Foley: تمايز متعدد الوسائط مع محاذاة التمثيل لإنشاء صوت فولي عالي الوضوح
Fara-7B: نموذج عامل فعّال لاستخدام الحاسوب
كوانتا ألفا: إطار تطوري لاستخراج ألفا يُقوده LLM
نمط تدريب مُوجَّه بالفجوة الوظيفية لمحاذاة الفراغات الفرعية للنماذج الكبيرة للغة متعددة الوسائط
MOVA: نحو توليد فيديو صوتي قابل للتوسع والمتزامن
MemoryLLM: ذاكرة تغذية أمامية قابلة للتشغيل الفوري وقابلة للتفسير لمحولات
DreamDojo: نموذج عالم روبوت متعدد الاستخدامات مستمد من مقاطع فيديو بشرية على نطاق واسع
F-GRPO: لا تسمح لسياسة التعلم بالتعلّم من الأشياء الواضحة ونسيان النادر
MSign: مُحسِّن يمنع عدم الاستقرار التدريبي في نماذج اللغة الكبيرة من خلال استعادة الرتبة المستقرة
AudioSAE: نحو فهم نماذج معالجة الصوت باستخدام المُشفّرات التلقائية النادرة
على ديناميكية الإنتروبيا في التحسين التدريجي للنماذج اللغوية الكبيرة
أوديسيا أرينا: تقييم النماذج اللغوية الكبيرة للتفاعلات الطويلة الأجل، والنشطة، والاستنتاجية
بايتشوان-م3: نمذجة الاستفسار السريري لاتخاذ قرارات طبية موثوقة
النمذجة التوليدية عبر الانزلاق
AlphaEdit: تحرير المعرفة المُقيَّد بمجال الصفر للنماذج اللغوية
التعلم للاستنتاج في 13 معلمة
DFlash: التبادل الكتلي للتكهن بالفك الشفاف السريع
إجبار السياق: توليد فيديو تلقائي متسلسل متسق مع سياق طويل
MemSkill: تعلّم وتطور المهارات الذاكرةية للوكلاء الذاتية التطوّر
تحسين سياسة التسلسل غير المُحَيَّز طوله: كشف التغير في طول الاستجابة وتحكم فيه في التعلم بالتعزيز القائم على التقييم
سبايدر-سنس: الكشف الداخلي عن المخاطر لدفاع الوكيل الفعّال مع التصفية التكيفية الهرمية
CAR-bench: تقييم الاتساق والوعي بالحدود لوكالات LLM في ظل عدم اليقين في العالم الحقيقي
التعلم المتدفق من نوع Sequence-to-Sequence مع نمذجة التدفقات المتأخرة (Delayed Streams)
Kiss3DGen: إعادة توظيف نماذج Image Diffusion لإنتاج 3D Asset
Conformer ذو الحالة (Stateful) مع استدلال قائم على الـ Cache لعملية التعرف التلقائي على الكلام (Automatic Speech Recognition) بنظام التدفق (Streaming)
Latents مهيكلة أصلية ومدمجة لتوليد 3D
نماذج اللغة الصوتية المستمرة (Continuous Audio Language Models)
تطوير Agent تشخيصي تفاعلي في بيئة سريرية افتراضية
WeDLM: مواءمة نماذج اللغة القائمة على الانتشار مع الانتباه السببي القياسي لاستخلاص سريع
توربو ديفوسيون: تسريع نماذج التفتيت الفيديو بنسبة 100 إلى 200 مرة
HunyuanVideo-Foley: تمايز متعدد الوسائط مع محاذاة التمثيل لإنشاء صوت فولي عالي الوضوح
Fara-7B: نموذج عامل فعّال لاستخدام الحاسوب