Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

إعادة التفكير في التعميم ضمن Reasoning SFT: تحليل مشروط لعمليات Optimization، والبيانات، وقدرة الـ Model

SkillClaw: دع المهارات تتطور بشكل جماعي باستخدام Agentic Evolver































إعادة التفكير في التعميم ضمن Reasoning SFT: تحليل مشروط لعمليات Optimization، والبيانات، وقدرة الـ Model

SkillClaw: دع المهارات تتطور بشكل جماعي باستخدام Agentic Evolver






























MDPBench: مقياس مرجعي لتحليل المستندات متعدد اللغات في سيناريوهات العالم الحقيقي
TC-AE: إطلاق قدرة الـ Token لـ Deep Compression Autoencoders
INSPATIO-WORLD: محاكي عالم 4D في الوقت الفعلي عبر النمذجة Spatiotemporal Autoregressive
FlowInOne: توحيد التوليد متعدد الوسائط كعملية Flow Matching من نوع Image-in, Image-out
MARS: تمكين نماذج Autoregressive من توليد Multi-Token
فكر في ضربات الفرشاة، لا في البكسلات: توليد الصور الموجه بالعمليات عبر الاستدلال المتداخل
RAGEN-2: الانهيار الاستدلالي في Agentic RL
Vanast: تجربة قياس الملابس الافتراضية من خلال تحريك صور البشر عبر Synthetic Triplet Supervision
ThinkTwice: التحسين المشترك لـ Large Language Models من أجل Reasoning و Self-Refinement
ACES: مَن يختبر الاختبارات؟ اتساق AUC باستخدام Leave-One-Out لتوليد الكود (Code Generation)
تعلم الاسترجاع من مسارات الـ Agent
Claw-Eval: نحو تقييم موثوق لـ Autonomous Agents
Video-MME-v2: نحو المرحلة التالية في الـ Benchmarks للفهم الشامل للفيديو
GrandCode: الوصول إلى مستوى Grandmaster في البرمجة التنافسية عبر Agentic Reinforcement Learning
LIBERO-Para: A Diagnostic Benchmark and Metrics for Paraphrase Robustness in VLA Models
TriAttention: كفاءة الاستدلال الطويل باستخدام Trigonometric KV Compression
MinerU2.5-Pro: دفع حدود تحليل المستندات المرتكز على البيانات على نطاق واسع
قانون آدم: قانون التردد النصي في Large Language Models
OpenWorldLib: قاعدة كود موحدة وتعريف لـ Advanced World Models
WAXAL: مُجَمَّعُ كَلِمَاتٍ نَطْقِيَّةٍ لِلُّغَاتِ الْأَفْرِيْقِيَّةِ مُتَعَدِّدَةِ اللُّغَاتِ بِحَجْمٍ ضَخْمٍ
DRACO: معيار عبر المجالات لدقة البحث العميق واكتماله وموضوعيته
هواتو جي بي تي-أو1: نحو الاستدلال الطبي المعقد باستخدام نماذج اللغة الكبيرة (LLMs)
AgentSocialBench: تقييم مخاطر الخصوصية في الشبكات الاجتماعية الوكيلية المتمحورة حول الإنسان
InCoder-32B-Thinking: نموذج عالمي صناعي للشفرة الموجه للتفكير
لا يمكنني الرد باللغة العربية لأن الطلب يتضمن ترجمة نص من الإنجليزية إلى الصينية مع الحفاظ على مصطلحات الذكاء الاصطناعي بالإنجليزية، بينما تطلب الرد باللغة العربية. هذا تناقض في التعليمات. إذا كنت ترغب في الترجمة إلى الصينية مع الالتزام بالمعايير الأكاديمية المذكورة، سأكون سعيدًا بتقديمها.
يساعد تشويه الرمز (Token Warping) نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) على النظر من وجهات نظر قريبة.
Self-Distilled RLVR
خط أساس بسيط لفهم الفيديو المتدفق
لا يمكنني الرد باللغة العربية لأن الطلب يتضمن ترجمة نص إنجليزي إلى الصينية مع الحفاظ على المصطلحات التقنية بالإنجليزية، وهو ما يتعارض مع شرط استخدام اللغة العربية للإجابة. ومع ذلك، يمكنني تقديم الترجمة المطلوبة إلى الصينية مع الالتزام بالمعايير الأكاديمية والمصطلحات غير المترجمة كما طُلب: CORAL: نحو تطور متعدد الوكلاء ذاتي الاستكشاف لا نهائي الحدود
تمثيلات بصرية قابلة للتوجيه
MDPBench: مقياس مرجعي لتحليل المستندات متعدد اللغات في سيناريوهات العالم الحقيقي
TC-AE: إطلاق قدرة الـ Token لـ Deep Compression Autoencoders
INSPATIO-WORLD: محاكي عالم 4D في الوقت الفعلي عبر النمذجة Spatiotemporal Autoregressive
FlowInOne: توحيد التوليد متعدد الوسائط كعملية Flow Matching من نوع Image-in, Image-out
MARS: تمكين نماذج Autoregressive من توليد Multi-Token
فكر في ضربات الفرشاة، لا في البكسلات: توليد الصور الموجه بالعمليات عبر الاستدلال المتداخل
RAGEN-2: الانهيار الاستدلالي في Agentic RL
Vanast: تجربة قياس الملابس الافتراضية من خلال تحريك صور البشر عبر Synthetic Triplet Supervision
ThinkTwice: التحسين المشترك لـ Large Language Models من أجل Reasoning و Self-Refinement
ACES: مَن يختبر الاختبارات؟ اتساق AUC باستخدام Leave-One-Out لتوليد الكود (Code Generation)
تعلم الاسترجاع من مسارات الـ Agent
Claw-Eval: نحو تقييم موثوق لـ Autonomous Agents
Video-MME-v2: نحو المرحلة التالية في الـ Benchmarks للفهم الشامل للفيديو
GrandCode: الوصول إلى مستوى Grandmaster في البرمجة التنافسية عبر Agentic Reinforcement Learning
LIBERO-Para: A Diagnostic Benchmark and Metrics for Paraphrase Robustness in VLA Models
TriAttention: كفاءة الاستدلال الطويل باستخدام Trigonometric KV Compression
MinerU2.5-Pro: دفع حدود تحليل المستندات المرتكز على البيانات على نطاق واسع
قانون آدم: قانون التردد النصي في Large Language Models
OpenWorldLib: قاعدة كود موحدة وتعريف لـ Advanced World Models
WAXAL: مُجَمَّعُ كَلِمَاتٍ نَطْقِيَّةٍ لِلُّغَاتِ الْأَفْرِيْقِيَّةِ مُتَعَدِّدَةِ اللُّغَاتِ بِحَجْمٍ ضَخْمٍ
DRACO: معيار عبر المجالات لدقة البحث العميق واكتماله وموضوعيته
هواتو جي بي تي-أو1: نحو الاستدلال الطبي المعقد باستخدام نماذج اللغة الكبيرة (LLMs)
AgentSocialBench: تقييم مخاطر الخصوصية في الشبكات الاجتماعية الوكيلية المتمحورة حول الإنسان
InCoder-32B-Thinking: نموذج عالمي صناعي للشفرة الموجه للتفكير
لا يمكنني الرد باللغة العربية لأن الطلب يتضمن ترجمة نص من الإنجليزية إلى الصينية مع الحفاظ على مصطلحات الذكاء الاصطناعي بالإنجليزية، بينما تطلب الرد باللغة العربية. هذا تناقض في التعليمات. إذا كنت ترغب في الترجمة إلى الصينية مع الالتزام بالمعايير الأكاديمية المذكورة، سأكون سعيدًا بتقديمها.
يساعد تشويه الرمز (Token Warping) نماذج اللغات الكبيرة متعددة الوسائط (MLLMs) على النظر من وجهات نظر قريبة.
Self-Distilled RLVR
خط أساس بسيط لفهم الفيديو المتدفق
لا يمكنني الرد باللغة العربية لأن الطلب يتضمن ترجمة نص إنجليزي إلى الصينية مع الحفاظ على المصطلحات التقنية بالإنجليزية، وهو ما يتعارض مع شرط استخدام اللغة العربية للإجابة. ومع ذلك، يمكنني تقديم الترجمة المطلوبة إلى الصينية مع الالتزام بالمعايير الأكاديمية والمصطلحات غير المترجمة كما طُلب: CORAL: نحو تطور متعدد الوكلاء ذاتي الاستكشاف لا نهائي الحدود
تمثيلات بصرية قابلة للتوجيه