Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

الاستكشاف القائم على Bootstrapping باستخدام التغذية الراجعة للغة الطبيعية على مستوى المجموعة في Reinforcement Learning

SocialOmni: تقييم التفاعل الاجتماعي السمعي البصري في نماذج Omni































الاستكشاف القائم على Bootstrapping باستخدام التغذية الراجعة للغة الطبيعية على مستوى المجموعة في Reinforcement Learning

SocialOmni: تقييم التفاعل الاجتماعي السمعي البصري في نماذج Omni






























DeepSeek-V4: نحو ذكاء سياقي فائق الكفاءة بمليون token
استكشاف الذكاء المكاني من منظور توليدي
DeVI: تفاعل بشري-شيئي بارع قائم على الفيزياء عبر محاكاة الفيديو الاصطناعي
اختراق المكافأة في عصر النماذج الكبيرة: الآليات، وعدم المحاذاة الناشئ، والتحديات
DR-Venus: نحو agents بحث عميق بمقياس حافة متطور باستخدام 10K فقط من البيانات المفتوحة
تحسين السياسات في المستقبل القريب
LLaDA2.0-Uni: توحيد الفهم والتوليد متعدد الوسائط باستخدام نماذج اللغة الكبيرة الانتشارية (Diffusion Large Language Model)
BioInstruct: ضبط التعليمات لـ Large Language Models في مجال معالجة اللغات الطبيعية الطبية الحيوية
التقرير الفني لـ Logics-Parsing-Omni
Task Tokens: نهج مرن لتكييف نماذج سلوك الأساس (Behavior Foundation Models)
Please provide the title you would like me to translate.
PlayCoder: جعل الكود المولد بواسطة LLM القابل للتشغيل في واجهات المستخدم الرسومية (GUI) قابلاً للعب
TEMPO: توسيع نطاق التدريب أثناء وقت الاختبار (Test-time Training) لنماذج الاستدلال الضخمة
AnyRecon: إعادة بناء ثلاثية الأبعاد من منظور عشوائي باستخدام نموذج Video Diffusion Model
AgentSPEX: لغة مواصفات وتنفيذ الـ agent
CoInteract: توليد فيديوهات التفاعل بين الإنسان والأشياء عبر التوليد المشترك ذي البنية المكانية المتوافقة فيزيائياً
Tstars-Tryon 1.0: تجربة قياس افتراضية قوية وواقعية لمختلف قطع الأزياء
نوى إلغاء تكميم NF4 سريعة لاستنتاج Large Language Model
EasyVideoR1: تعزيز التعلم المعزز (RL) لتسهيل فهم الفيديو
MultiWorld: نماذج عالم فيديو متعددة المناظر ومتعددة الـ agents وقابلة للتوسع
OpenGame: البرمجة الوكالية المفتوحة للألعاب (Open Agentic Coding for Games)
Agent-World: توسيع نطاق تخليق بيئات العالم الحقيقي من أجل ذكاء agent عام متطور
OneVL: الاستنتاج والتخطيط الكامن في خطوة واحدة مع التفسير البصري اللغوي
توسيع توليد الصور بخطوة واحدة من تسميات الفئات إلى النصوص عبر تمثيل نصي تمييزي
ScribblePrompt: تقسيم تفاعلي سريع ومرن لأي صورة طبية حيوية
Long-VITA: توسيع نطاق Large Multi-modal Models لتصل إلى 1 Million tokens مع دقة رائدة في السياقات القصيرة (Short-Context)
UI-TARS: ريادة التفاعل المؤتمت مع واجهة المستخدم الرسومية (GUI) باستخدام Native Agents
HunyuanVideo: إطار عمل منهجي لنماذج توليد الفيديو الكبيرة (Large Video Generative Models)
MathNet: معيار عالمي متعدد الوسائط للاستدلال الرياضي والاسترجاع
الاستدلال الخارجي في LLM Agents: مراجعة موحدة للذاكرة، والمهارات، والبروتوكولات، وهندسة Harness
DeepSeek-V4: نحو ذكاء سياقي فائق الكفاءة بمليون token
استكشاف الذكاء المكاني من منظور توليدي
DeVI: تفاعل بشري-شيئي بارع قائم على الفيزياء عبر محاكاة الفيديو الاصطناعي
اختراق المكافأة في عصر النماذج الكبيرة: الآليات، وعدم المحاذاة الناشئ، والتحديات
DR-Venus: نحو agents بحث عميق بمقياس حافة متطور باستخدام 10K فقط من البيانات المفتوحة
تحسين السياسات في المستقبل القريب
LLaDA2.0-Uni: توحيد الفهم والتوليد متعدد الوسائط باستخدام نماذج اللغة الكبيرة الانتشارية (Diffusion Large Language Model)
BioInstruct: ضبط التعليمات لـ Large Language Models في مجال معالجة اللغات الطبيعية الطبية الحيوية
التقرير الفني لـ Logics-Parsing-Omni
Task Tokens: نهج مرن لتكييف نماذج سلوك الأساس (Behavior Foundation Models)
Please provide the title you would like me to translate.
PlayCoder: جعل الكود المولد بواسطة LLM القابل للتشغيل في واجهات المستخدم الرسومية (GUI) قابلاً للعب
TEMPO: توسيع نطاق التدريب أثناء وقت الاختبار (Test-time Training) لنماذج الاستدلال الضخمة
AnyRecon: إعادة بناء ثلاثية الأبعاد من منظور عشوائي باستخدام نموذج Video Diffusion Model
AgentSPEX: لغة مواصفات وتنفيذ الـ agent
CoInteract: توليد فيديوهات التفاعل بين الإنسان والأشياء عبر التوليد المشترك ذي البنية المكانية المتوافقة فيزيائياً
Tstars-Tryon 1.0: تجربة قياس افتراضية قوية وواقعية لمختلف قطع الأزياء
نوى إلغاء تكميم NF4 سريعة لاستنتاج Large Language Model
EasyVideoR1: تعزيز التعلم المعزز (RL) لتسهيل فهم الفيديو
MultiWorld: نماذج عالم فيديو متعددة المناظر ومتعددة الـ agents وقابلة للتوسع
OpenGame: البرمجة الوكالية المفتوحة للألعاب (Open Agentic Coding for Games)
Agent-World: توسيع نطاق تخليق بيئات العالم الحقيقي من أجل ذكاء agent عام متطور
OneVL: الاستنتاج والتخطيط الكامن في خطوة واحدة مع التفسير البصري اللغوي
توسيع توليد الصور بخطوة واحدة من تسميات الفئات إلى النصوص عبر تمثيل نصي تمييزي
ScribblePrompt: تقسيم تفاعلي سريع ومرن لأي صورة طبية حيوية
Long-VITA: توسيع نطاق Large Multi-modal Models لتصل إلى 1 Million tokens مع دقة رائدة في السياقات القصيرة (Short-Context)
UI-TARS: ريادة التفاعل المؤتمت مع واجهة المستخدم الرسومية (GUI) باستخدام Native Agents
HunyuanVideo: إطار عمل منهجي لنماذج توليد الفيديو الكبيرة (Large Video Generative Models)
MathNet: معيار عالمي متعدد الوسائط للاستدلال الرياضي والاسترجاع
الاستدلال الخارجي في LLM Agents: مراجعة موحدة للذاكرة، والمهارات، والبروتوكولات، وهندسة Harness