Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

AdaGaR: تمثيل غابور التكيفي لإعادة بناء المشاهد الديناميكية

تَقْوِيمُ التَّوَهُّمَات: تعزيز فَهْمِ MLLMs للفيديوهات من خلال تَوْجِيهِ إِنْتَاجِ الفيديوهات الْمُتَقَدِّمَةِ































AdaGaR: تمثيل غابور التكيفي لإعادة بناء المشاهد الديناميكية

تَقْوِيمُ التَّوَهُّمَات: تعزيز فَهْمِ MLLMs للفيديوهات من خلال تَوْجِيهِ إِنْتَاجِ الفيديوهات الْمُتَقَدِّمَةِ






























SenseNova-MARS: تمكين الاستدلال والبحث الوظيفي متعدد الوسائط من خلال التعلم المعزز
إجبار الصورة الرمزية: توليد صورة رمزية للرأس التفاعلية في الوقت الفعلي للمحادثة الطبيعية
نيوورس: تحسين نموذج العالم الأربعة أبعاد من خلال مقاطع فيديو مونوكولار في البيئة الطبيعية
Youtu-Agent: تعزيز إنتاجية الوكيل من خلال التوليد التلقائي وتحسين السياسة الهجينة
تقرير فني حول IQuest-Coder-V1
نماذج اللغة التكرارية
FlowBlending: عينة متعددة النماذج واعية بالمرحلة لإنشاء فيديو سريع وعالي الولادة
Dream2Flow: ربط إنشاء الفيديو والتعديل في العالم المفتوح باستخدام تدفق الكائنات ثلاثية الأبعاد
في دور التفرّق في نماذج LLMs التبادلية
DiffThinker: نحو الاستدلال متعدد الوسائط التوليدي مع نماذج التشتت
النماذج الكبيرة للمسائل الديناميكية: الاستدلال الخفي في فضاء معنوي تكيفي
تحسين التوليد المتعدد الخطوات باستخدام RAG مع الذاكرة القائمة على الرسوم البيانية الفائقة للنمذجة المعقدة للعلاقات ذات السياق الطويل
الذكاء الاصطناعي يلتقي بالدماغ: أنظمة الذاكرة من العلوم الإدراكية العصبية إلى الوكلاء المستقلين
توسيع التفكير المفتوح النهاية للتنبؤ بالمستقبل
GaMO: إعادة تشكيل ثلاثي الأبعاد من منظور متباعد باستخدام توليد تمايز متعدد المنظورات واعية بالهندسة
mHC: اتصالات فائقة مقيدة بالمنافذ
دعه يجري: الصناعة الواعية على الروك أند رول، بناء نموذج ROME داخل نظام تعلّم واعٍ مفتوح
يوتو-إل إم: فتح الإمكانات الوكيلة الأصلية للنماذج اللغوية الكبيرة الخفيفة
GateBreaker: هجمات موجهة بالبوابات على نماذج LLM المختلطة من الخبراء
GraphLocator: استدلال سببي موجه بالرسم البياني لتحديد المواقع المشكلة
تقييم الطرق الفعّالة من حيث المعلّمات لـ RLVR
تدريب زمني تشغيلي من النهاية إلى النهاية للسياقات الطويلة
DreamOmni3: تحرير وتحفيز مبني على الرسم التخطيطي
UltraShape 1.0: إنشاء أشكال ثلاثية الأبعاد عالية الدقة عبر تحسين هندسي قابل للتوسع
ميميك-فيديو: نماذج الفيديو-العملية للتحكم في الروبوتات القابلة للتوسع خارج نماذج الفيديو-اللغة
HY-Motion 1.0: توسيع نماذج مطابقة التدفق لتحويل النص إلى الحركة
SurgWorld: تعلّم سياسات الروبوت الجراحي من الفيديوهات من خلال نمذجة العالم
SpotEdit: التحرير الإنتقائي للمناطق في محولات التشتت
التفتّح يُدرك الشفافية: إعادة توظيف التفتيت الفيديو لتقدير عمق الأجسام الشفافة واتجاهاتها الطبيعية
SmartSnap: استكشاف دلائل تلقائي لوكالات ذاتية التحقق
SenseNova-MARS: تمكين الاستدلال والبحث الوظيفي متعدد الوسائط من خلال التعلم المعزز
إجبار الصورة الرمزية: توليد صورة رمزية للرأس التفاعلية في الوقت الفعلي للمحادثة الطبيعية
نيوورس: تحسين نموذج العالم الأربعة أبعاد من خلال مقاطع فيديو مونوكولار في البيئة الطبيعية
Youtu-Agent: تعزيز إنتاجية الوكيل من خلال التوليد التلقائي وتحسين السياسة الهجينة
تقرير فني حول IQuest-Coder-V1
نماذج اللغة التكرارية
FlowBlending: عينة متعددة النماذج واعية بالمرحلة لإنشاء فيديو سريع وعالي الولادة
Dream2Flow: ربط إنشاء الفيديو والتعديل في العالم المفتوح باستخدام تدفق الكائنات ثلاثية الأبعاد
في دور التفرّق في نماذج LLMs التبادلية
DiffThinker: نحو الاستدلال متعدد الوسائط التوليدي مع نماذج التشتت
النماذج الكبيرة للمسائل الديناميكية: الاستدلال الخفي في فضاء معنوي تكيفي
تحسين التوليد المتعدد الخطوات باستخدام RAG مع الذاكرة القائمة على الرسوم البيانية الفائقة للنمذجة المعقدة للعلاقات ذات السياق الطويل
الذكاء الاصطناعي يلتقي بالدماغ: أنظمة الذاكرة من العلوم الإدراكية العصبية إلى الوكلاء المستقلين
توسيع التفكير المفتوح النهاية للتنبؤ بالمستقبل
GaMO: إعادة تشكيل ثلاثي الأبعاد من منظور متباعد باستخدام توليد تمايز متعدد المنظورات واعية بالهندسة
mHC: اتصالات فائقة مقيدة بالمنافذ
دعه يجري: الصناعة الواعية على الروك أند رول، بناء نموذج ROME داخل نظام تعلّم واعٍ مفتوح
يوتو-إل إم: فتح الإمكانات الوكيلة الأصلية للنماذج اللغوية الكبيرة الخفيفة
GateBreaker: هجمات موجهة بالبوابات على نماذج LLM المختلطة من الخبراء
GraphLocator: استدلال سببي موجه بالرسم البياني لتحديد المواقع المشكلة
تقييم الطرق الفعّالة من حيث المعلّمات لـ RLVR
تدريب زمني تشغيلي من النهاية إلى النهاية للسياقات الطويلة
DreamOmni3: تحرير وتحفيز مبني على الرسم التخطيطي
UltraShape 1.0: إنشاء أشكال ثلاثية الأبعاد عالية الدقة عبر تحسين هندسي قابل للتوسع
ميميك-فيديو: نماذج الفيديو-العملية للتحكم في الروبوتات القابلة للتوسع خارج نماذج الفيديو-اللغة
HY-Motion 1.0: توسيع نماذج مطابقة التدفق لتحويل النص إلى الحركة
SurgWorld: تعلّم سياسات الروبوت الجراحي من الفيديوهات من خلال نمذجة العالم
SpotEdit: التحرير الإنتقائي للمناطق في محولات التشتت
التفتّح يُدرك الشفافية: إعادة توظيف التفتيت الفيديو لتقدير عمق الأجسام الشفافة واتجاهاتها الطبيعية
SmartSnap: استكشاف دلائل تلقائي لوكالات ذاتية التحقق