Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

يومي-1.5: نموذج توليد عالم تفاعلي يُتحكم به نصيًا

LiveTalk: توليد فيديو تفاعلي متعدد الوسائط في الزمن الفعلي عبر استخلاص سياسة محسّنة































يومي-1.5: نموذج توليد عالم تفاعلي يُتحكم به نصيًا

LiveTalk: توليد فيديو تفاعلي متعدد الوسائط في الزمن الفعلي عبر استخلاص سياسة محسّنة






























توصيل الخبراء والراوترز في مزيج الخبراء من خلال خسارة مساعدة
LongFly: التوجيه البصري واللغوي للطائرات بدون طيار على مدى طويل مع دمج السياق الزماني المكاني
الانتباه ليس ما تحتاجه
SlideTailor: توليد عروض تقديمية شخصية للمقالات العلمية
InSight-o3: تمكين النماذج الأساسية متعددة الوسائط من خلال البحث البصري العام
InsertAnywhere: تجسيم البنية الهندسية لمشهد رباعي الأبعاد ونماذج الانتشار لدمج كائنات فيديو واقعية
الاسترجاع المُعزّز بالإنشاء الواعي بمساحة الأفكار لتحسين الفهم للسياقات الطويلة
قياس صحة النموذج القصير في النماذج اللغوية الكبيرة
DeepSearchQA: سد الفجوة الشاملة لوكالات البحث العميق
MEM1: تعلّم التآزر بين الذاكرة والتفكير من أجل وكالات فعّالة على المدى الطويل
مُتداول الذكاء الاصطناعي: تقييم الوكلاء المستقلين في الأسواق المالية الزمنية الحقيقية
الاستدلال البصري الضمني الخفي
الهويات النمطية للنماذج اللغوية الكبيرة كبدائل عن التجارب الميدانية في تقييم الأساليب
DataFlow: إطار مدعوم بالذكاء الاصطناعي من نوع LLM لتجهيز البيانات الموحّد وأتمتة العمليات في عصر الذكاء الاصطناعي المتمحور حول البيانات
HiStream: توليد فيديو عالي الدقة بكفاءة من خلال التدفق المُزيل للإعادة
TokSuite: قياس تأثير اختيار المُحلِّل النصي على سلوك نموذج اللغة
Nemotron 3 Nano: نموذج هجين ممبَا-ترانسفورمر مزيج الخبراء المفتوح والفعال للتفكير الوظيفي
ما وراء التذكّر: معيار ترتيب تعددية الوسائط للكشف عن التحيز في الشعبية في نماذج الرؤية واللغة
DreaMontage: توليد فيديو واحد بالاعتماد على إطار محدد بشكل عشوائي
T2AV-Compass: نحو تقييم موحد لتحويل النص إلى الصوت والفيديو
TongSIM: منصة عامة لمحاكاة الآلات الذكية
Qwen-Image-Layered: نحو القابلية للتعديل التلقائية من خلال تحليل الطبقات
روبو سيف: حماية الوكلاء الماديّين من خلال منطق السلامة القابل للتنفيذ
تقييم واقعي لمراجعات سلامة الأدوية بواسطة النماذج اللغوية الكبيرة في الرعاية الأولية بخدمة الصحة الوطنية
تحليل موضوعي متعدد LLM باستخدام مقاييس موثوقية مزدوجة: دمج كوفا وشبه التشابه الدلالي لتأكيد البحث النوعي
الذكاء النشط في الأفاتار المرئية من خلال نمذجة العالم الدائرية المغلقة
FaithLens: اكتشاف وتفسير التضليل المتعلق بالولاء
SAM الصوتي: التجزئة بأي شيء في الصوت
تقرير تقني حول Step-DeepResearch
SpatialTree: كيف تتشعب القدرات المكانية في MLLMs
توصيل الخبراء والراوترز في مزيج الخبراء من خلال خسارة مساعدة
LongFly: التوجيه البصري واللغوي للطائرات بدون طيار على مدى طويل مع دمج السياق الزماني المكاني
الانتباه ليس ما تحتاجه
SlideTailor: توليد عروض تقديمية شخصية للمقالات العلمية
InSight-o3: تمكين النماذج الأساسية متعددة الوسائط من خلال البحث البصري العام
InsertAnywhere: تجسيم البنية الهندسية لمشهد رباعي الأبعاد ونماذج الانتشار لدمج كائنات فيديو واقعية
الاسترجاع المُعزّز بالإنشاء الواعي بمساحة الأفكار لتحسين الفهم للسياقات الطويلة
قياس صحة النموذج القصير في النماذج اللغوية الكبيرة
DeepSearchQA: سد الفجوة الشاملة لوكالات البحث العميق
MEM1: تعلّم التآزر بين الذاكرة والتفكير من أجل وكالات فعّالة على المدى الطويل
مُتداول الذكاء الاصطناعي: تقييم الوكلاء المستقلين في الأسواق المالية الزمنية الحقيقية
الاستدلال البصري الضمني الخفي
الهويات النمطية للنماذج اللغوية الكبيرة كبدائل عن التجارب الميدانية في تقييم الأساليب
DataFlow: إطار مدعوم بالذكاء الاصطناعي من نوع LLM لتجهيز البيانات الموحّد وأتمتة العمليات في عصر الذكاء الاصطناعي المتمحور حول البيانات
HiStream: توليد فيديو عالي الدقة بكفاءة من خلال التدفق المُزيل للإعادة
TokSuite: قياس تأثير اختيار المُحلِّل النصي على سلوك نموذج اللغة
Nemotron 3 Nano: نموذج هجين ممبَا-ترانسفورمر مزيج الخبراء المفتوح والفعال للتفكير الوظيفي
ما وراء التذكّر: معيار ترتيب تعددية الوسائط للكشف عن التحيز في الشعبية في نماذج الرؤية واللغة
DreaMontage: توليد فيديو واحد بالاعتماد على إطار محدد بشكل عشوائي
T2AV-Compass: نحو تقييم موحد لتحويل النص إلى الصوت والفيديو
TongSIM: منصة عامة لمحاكاة الآلات الذكية
Qwen-Image-Layered: نحو القابلية للتعديل التلقائية من خلال تحليل الطبقات
روبو سيف: حماية الوكلاء الماديّين من خلال منطق السلامة القابل للتنفيذ
تقييم واقعي لمراجعات سلامة الأدوية بواسطة النماذج اللغوية الكبيرة في الرعاية الأولية بخدمة الصحة الوطنية
تحليل موضوعي متعدد LLM باستخدام مقاييس موثوقية مزدوجة: دمج كوفا وشبه التشابه الدلالي لتأكيد البحث النوعي
الذكاء النشط في الأفاتار المرئية من خلال نمذجة العالم الدائرية المغلقة
FaithLens: اكتشاف وتفسير التضليل المتعلق بالولاء
SAM الصوتي: التجزئة بأي شيء في الصوت
تقرير تقني حول Step-DeepResearch
SpatialTree: كيف تتشعب القدرات المكانية في MLLMs