Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

مزيج من السياقات لإنشاء مقاطع فيديو طويلة

MusicSwarm: ذكاء مستوحى من الطبيعة لتأليف الموسيقى































مزيج من السياقات لإنشاء مقاطع فيديو طويلة

MusicSwarm: ذكاء مستوحى من الطبيعة لتأليف الموسيقى






























LEGO: توليد وتحسين المُسرِّع المكاني لتطبيقات المصفوفات
LazyDrag: تمكين التحرير القائم على السحب المستقر على نماذج التشتت متعددة الوسائط عبر التحويلات عبر التوافق الصريح
SearchInstruct: تحسين التكيّف النطاقي من خلال إنشاء مجموعة بيانات تعليمية تعتمد على الاسترجاع
استنتاج فيزيائي قابل للتفسير وتصنيف أداء في نماذج الرؤية واللغة
InternScenes: مجموعة بيانات مساحات داخلية كبيرة القوام مع إمكانية المحاكاة وتصميمات واقعية
UI-S1: تطوير الأتمتة الرسومية عبر التعلم المعزز شبه الزمن الحقيقي
OmniWorld: مجموعة بيانات متعددة المجالات ومتعددة الوسائط لنمذجة العالم الأربعة الأبعاد
LAVa: إزالة ذاكرة التخزين المؤقت للقيم المفتاحية طبقًا للطبقات مع تخصيص ميزانية ديناميكية
نمذجة العالم مع دمج البنية الاحتمالية
VStyle: معيار لتكييف نبرة الصوت باستخدام تعليمات شفهية
هانراج: استرجاع مدعوم بالتوسيع الدقيق المقاوم للضوضاء القائم على خوارزمية استباقية للإجابة على الأسئلة متعددة الخطوات
InfGen: منهجية غير تعتمد على الدقة لتصنيع الصور القابلة للتوسع
قسم X: تحليل الشكل عالي الولاء والملائمة الهيكلية
وهم العائدات المتناقصة: قياس التنفيذ على المدى الطويل في نماذج اللغة الكبيرة
IntrEx: مجموعة بيانات لنمذجة المشاركة في المحادثات التعليمية
يوتوب-جراف راج: وكلاء موحّدون رأسيًا للتفكير المعقد المدعوم باسترجاع الرسم البياني
SceneSplat: فهم المشهد المستند إلى التبديد الغاوسي مع التدريب المسبق للرؤية واللغة
اقتصاديات الوكيل الافتراضي
إلى فهم التثبيت البصري في نماذج اللغة والصورة
كْلِينغ-Avatar: ترسيخ التعليمات متعددة الوسائط لتخليق تسلسلي لحركة الصورة الظلية الطويلة الأمد
نماذج التعلم الآلي LM: التدريب المستمر لنماذج اللغة على ملايين المهام الاصطناعية الجدولية التنبؤية يُدرّب التعلم الآلي في السياق
إيكو إكس: نحو تقليل الفجوة الصوتية-الدلالية من خلال التدريب بالصدى لنماذج اللغة الكبيرة للتحويل الصوتي-الصوتي
SimpleVLA-RL: توسيع تدريب VLA من خلال التعلم المعزز
VLA-Adapter: نموذج فعّال لنمذجة الرؤية واللغة والفعل بحجم صغير جدًا
scSiameseClu: إطار تجميع سيميز لفهم بيانات التسلسل الحمض النووي الريبي للخلايا الواحدة
ست-رابتور: إجابة الأسئلة حول الجداول شبه المنظمة بدعم من نماذج اللغة الكبيرة
OmniSpatial: نحو معيار شامل لاستدلال مكاني لنماذج الرؤية واللغة
فهم التنازلات الاقتصادية بين الوكلاء البشريين والوكلاء الذكية في ألعاب التفاوض
أُوبيتير: تحسين قدرات تحليل بيانات نموذج اللغة الكبير من خلال البحث الموجه بالقيمة في مذكرة ووقت الاستنتاج
تقرير تقني عن Hunyuan-MT
LEGO: توليد وتحسين المُسرِّع المكاني لتطبيقات المصفوفات
LazyDrag: تمكين التحرير القائم على السحب المستقر على نماذج التشتت متعددة الوسائط عبر التحويلات عبر التوافق الصريح
SearchInstruct: تحسين التكيّف النطاقي من خلال إنشاء مجموعة بيانات تعليمية تعتمد على الاسترجاع
استنتاج فيزيائي قابل للتفسير وتصنيف أداء في نماذج الرؤية واللغة
InternScenes: مجموعة بيانات مساحات داخلية كبيرة القوام مع إمكانية المحاكاة وتصميمات واقعية
UI-S1: تطوير الأتمتة الرسومية عبر التعلم المعزز شبه الزمن الحقيقي
OmniWorld: مجموعة بيانات متعددة المجالات ومتعددة الوسائط لنمذجة العالم الأربعة الأبعاد
LAVa: إزالة ذاكرة التخزين المؤقت للقيم المفتاحية طبقًا للطبقات مع تخصيص ميزانية ديناميكية
نمذجة العالم مع دمج البنية الاحتمالية
VStyle: معيار لتكييف نبرة الصوت باستخدام تعليمات شفهية
هانراج: استرجاع مدعوم بالتوسيع الدقيق المقاوم للضوضاء القائم على خوارزمية استباقية للإجابة على الأسئلة متعددة الخطوات
InfGen: منهجية غير تعتمد على الدقة لتصنيع الصور القابلة للتوسع
قسم X: تحليل الشكل عالي الولاء والملائمة الهيكلية
وهم العائدات المتناقصة: قياس التنفيذ على المدى الطويل في نماذج اللغة الكبيرة
IntrEx: مجموعة بيانات لنمذجة المشاركة في المحادثات التعليمية
يوتوب-جراف راج: وكلاء موحّدون رأسيًا للتفكير المعقد المدعوم باسترجاع الرسم البياني
SceneSplat: فهم المشهد المستند إلى التبديد الغاوسي مع التدريب المسبق للرؤية واللغة
اقتصاديات الوكيل الافتراضي
إلى فهم التثبيت البصري في نماذج اللغة والصورة
كْلِينغ-Avatar: ترسيخ التعليمات متعددة الوسائط لتخليق تسلسلي لحركة الصورة الظلية الطويلة الأمد
نماذج التعلم الآلي LM: التدريب المستمر لنماذج اللغة على ملايين المهام الاصطناعية الجدولية التنبؤية يُدرّب التعلم الآلي في السياق
إيكو إكس: نحو تقليل الفجوة الصوتية-الدلالية من خلال التدريب بالصدى لنماذج اللغة الكبيرة للتحويل الصوتي-الصوتي
SimpleVLA-RL: توسيع تدريب VLA من خلال التعلم المعزز
VLA-Adapter: نموذج فعّال لنمذجة الرؤية واللغة والفعل بحجم صغير جدًا
scSiameseClu: إطار تجميع سيميز لفهم بيانات التسلسل الحمض النووي الريبي للخلايا الواحدة
ست-رابتور: إجابة الأسئلة حول الجداول شبه المنظمة بدعم من نماذج اللغة الكبيرة
OmniSpatial: نحو معيار شامل لاستدلال مكاني لنماذج الرؤية واللغة
فهم التنازلات الاقتصادية بين الوكلاء البشريين والوكلاء الذكية في ألعاب التفاوض
أُوبيتير: تحسين قدرات تحليل بيانات نموذج اللغة الكبير من خلال البحث الموجه بالقيمة في مذكرة ووقت الاستنتاج
تقرير تقني عن Hunyuan-MT