Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

التحفيز المُجَرَّد: توليد فيديو تدفقي فعّال من خلال التقطيع المطابق للتوزيع المُحَفَّز

الدلالات تقود الطريق: مواءمة النمذجة الدلالية والنمذجة النسيجية باستخدام التمايز الخفي المتزامن غير المتماثل































التحفيز المُجَرَّد: توليد فيديو تدفقي فعّال من خلال التقطيع المطابق للتوزيع المُحَفَّز

الدلالات تقود الطريق: مواءمة النمذجة الدلالية والنمذجة النسيجية باستخدام التمايز الخفي المتزامن غير المتماثل






























ARM-Thinker: تعزيز نماذج المكافأة التوليدية متعددة الوسائط من خلال استخدام الأدوات الوكيلية والتفكير البصري
نيكس-ن1: نماذج عاملية تم تدريبها عبر نظام بيئي موحد لبناء بيئات على نطاق واسع
DAComp: تقييم الوكالات البيانات عبر دورة حياة الذكاء البيانات بالكامل
الصورة الحية: توليد صورة حية مُدفَّعة بالصوت في الوقت الفعلي مع طول لا نهائي
F5-TTS: ساحر يُقلّد كلامًا سلسًا ودقيقًا باستخدام مطابقة التدفق
VOccl3D: مجموعة بيانات تقييم فيديو لتقدير وضعية وشكل الإنسان ثلاثي الأبعاد في ظل حالات احتجاز حقيقية
ألبامايو-آر1: جسر بين الاستنتاج والتنبؤ بالسلوك لتحقيق القيادة الذاتية القابلة للتوسع في الذيل الطويل
كل شيء مترابط: رحلة عبر التذكّر في وقت الاختبار، والانحياز الانتباهي، والاحتفاظ، والتحسين عبر الإنترنت
إعادة التفكير في تصميم المُدخلات لتسcaling أثناء الاستدلال في التوليد النصي-البصري
توجيه نماذج الرؤية واللغة والعمل كاستكشاف مضاد: نهج مُدرَج في وقت الاختبار
OneThinker: نموذج استنتاج شامل لكل من الصور والفيديوهات
ViDiC: التصنيف التوضيحي للفرق في الفيديو
PretrainZero: التدريب النشط التمهيدي المعزز
كل رمز يهم: تعميم السياق الفائق الطول بحجم 16 مليون في نماذج اللغة الكبيرة
سيم سكيل: تعلّم القيادة من خلال المحاكاة الواقعية على نطاق واسع
Skywork-R1V4: نحو الذكاء المتعدد الوسائط الواعي من خلال التفكير المتناوب مع الصور والبحث العميق
النماذج اللغوية الكبيرة المُتَطوِّرة ذاتيًا المُرشَدَة بحد أدنى من الإشراف البشري
MultiShotMaster: إطار عمل قابل للتحكم لإنشاء مقاطع فيديو متعددة اللقطات
MG-Nav: التوجيه البصري ثنائي المقياس من خلال الذاكرة المكانية النادرة
مُنتقد الاتساق: إصلاح التناقضات في الصور المولّدة من خلال التحديد الانتباهي المُوجَّه بالمرجع
ما مدى بُعدنا عن وكالات بحث عميقة فعلاً مفيدة؟
استقرار التعلم التعزيزي باستخدام نماذج اللغة الكبيرة: الصياغة والتطبيق
إيفرزون: تقييم التفاهم الموحّد والإنتاج من أجل رؤى عملية العالم السببية
LongVT: تشجيع "التفكير مع مقاطع الفيديو الطويلة" من خلال استدعاء الأدوات الأصلية
من نماذج التأسيس البرمجي إلى الوكلاء والتطبيقات: دليل عملي للذكاء البرمجي
نمذجة زمنية مكانية مدفوعة بالفيزياء للكشف عن مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي
ميم-ألفا: تعلّم بناء الذاكرة من خلال التعلّم المعزّز
البحث في اللعب الذاتي: دفع حدود القدرة الوكيلية دون إشراف
CudaForge: إطار وكيل يعتمد على التغذية الراجعة من المعدات لتحسين نوى CUDA
ScaleNet: توسيع الشبكات العصبية المُدرّبة مسبقًا باستخدام معاملات تدريجية
ARM-Thinker: تعزيز نماذج المكافأة التوليدية متعددة الوسائط من خلال استخدام الأدوات الوكيلية والتفكير البصري
نيكس-ن1: نماذج عاملية تم تدريبها عبر نظام بيئي موحد لبناء بيئات على نطاق واسع
DAComp: تقييم الوكالات البيانات عبر دورة حياة الذكاء البيانات بالكامل
الصورة الحية: توليد صورة حية مُدفَّعة بالصوت في الوقت الفعلي مع طول لا نهائي
F5-TTS: ساحر يُقلّد كلامًا سلسًا ودقيقًا باستخدام مطابقة التدفق
VOccl3D: مجموعة بيانات تقييم فيديو لتقدير وضعية وشكل الإنسان ثلاثي الأبعاد في ظل حالات احتجاز حقيقية
ألبامايو-آر1: جسر بين الاستنتاج والتنبؤ بالسلوك لتحقيق القيادة الذاتية القابلة للتوسع في الذيل الطويل
كل شيء مترابط: رحلة عبر التذكّر في وقت الاختبار، والانحياز الانتباهي، والاحتفاظ، والتحسين عبر الإنترنت
إعادة التفكير في تصميم المُدخلات لتسcaling أثناء الاستدلال في التوليد النصي-البصري
توجيه نماذج الرؤية واللغة والعمل كاستكشاف مضاد: نهج مُدرَج في وقت الاختبار
OneThinker: نموذج استنتاج شامل لكل من الصور والفيديوهات
ViDiC: التصنيف التوضيحي للفرق في الفيديو
PretrainZero: التدريب النشط التمهيدي المعزز
كل رمز يهم: تعميم السياق الفائق الطول بحجم 16 مليون في نماذج اللغة الكبيرة
سيم سكيل: تعلّم القيادة من خلال المحاكاة الواقعية على نطاق واسع
Skywork-R1V4: نحو الذكاء المتعدد الوسائط الواعي من خلال التفكير المتناوب مع الصور والبحث العميق
النماذج اللغوية الكبيرة المُتَطوِّرة ذاتيًا المُرشَدَة بحد أدنى من الإشراف البشري
MultiShotMaster: إطار عمل قابل للتحكم لإنشاء مقاطع فيديو متعددة اللقطات
MG-Nav: التوجيه البصري ثنائي المقياس من خلال الذاكرة المكانية النادرة
مُنتقد الاتساق: إصلاح التناقضات في الصور المولّدة من خلال التحديد الانتباهي المُوجَّه بالمرجع
ما مدى بُعدنا عن وكالات بحث عميقة فعلاً مفيدة؟
استقرار التعلم التعزيزي باستخدام نماذج اللغة الكبيرة: الصياغة والتطبيق
إيفرزون: تقييم التفاهم الموحّد والإنتاج من أجل رؤى عملية العالم السببية
LongVT: تشجيع "التفكير مع مقاطع الفيديو الطويلة" من خلال استدعاء الأدوات الأصلية
من نماذج التأسيس البرمجي إلى الوكلاء والتطبيقات: دليل عملي للذكاء البرمجي
نمذجة زمنية مكانية مدفوعة بالفيزياء للكشف عن مقاطع الفيديو التي تم إنشاؤها بواسطة الذكاء الاصطناعي
ميم-ألفا: تعلّم بناء الذاكرة من خلال التعلّم المعزّز
البحث في اللعب الذاتي: دفع حدود القدرة الوكيلية دون إشراف
CudaForge: إطار وكيل يعتمد على التغذية الراجعة من المعدات لتحسين نوى CUDA
ScaleNet: توسيع الشبكات العصبية المُدرّبة مسبقًا باستخدام معاملات تدريجية