Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

FlashMemory-DeepSeek-V4: فهرس البرق للسياق فائق الطول عبر انتباه متناثر ذو نظرة إلى الأمام

المهارة الكامنة: من المهارات النصية ضمن السياق إلى المهارات الكامنة في الأوزان لوكلاء LLM agents































FlashMemory-DeepSeek-V4: فهرس البرق للسياق فائق الطول عبر انتباه متناثر ذو نظرة إلى الأمام

المهارة الكامنة: من المهارات النصية ضمن السياق إلى المهارات الكامنة في الأوزان لوكلاء LLM agents






























CoVEBench: هل يمكن لنماذج تحرير الفيديو التعامل مع التعليمات المعقدة؟
الذاكرة المكانية الكامنة لنماذج العالم للفيديو
حول هندسة التقطير على السياسة
SWE-Explore: تقييم كيفية استكشاف وكلاء البرمجة Agents للمستودعات
تقرير تقني حول VoxCPM2
التقرير الفني الخاص بـ LongCat-Video-Avatar 1.5
ChartNet: مجموعة بيانات متعددة الوسائط عالية الجودة وذات مقياس يتجاوز المليون لفهم المخططات البيانية بشكل قوي
ACL-Verbatim: الإجابة على الأسئلة الخالية من الهلوسة في مجال البحث
ما وراء الحوارات الثابتة: تقييم ذاكرة طويلة المدى واقعية ومتباينة ومتطورة
نهاية هندسة البرمجيات: كيف تعمل وكلاء الذكاء الاصطناعي على إعادة هيكلة النموذج البرمجي بشكل جذري
لماذا تتعلم النماذج الأكبر بشكل أفضل: تأثيرات السعة، والتداخل، والاحتفاظ بالمهام النادرة
عندما تفشل الأدوات: تقييم المعايير لإعادة التخطيط الديناميكي والتعافي من الشذوذ في LLM Agents
الإدراج المباشر للكائنات الواعي بالثلاثي الأبعاد عبر الوكلاء البصريين المفككين
AnchorWorld: محاكاة العالم المتجسد الذاتي باستخدام تخصيص التطور القائم على المنظور
SoCRATES: نحو تقييم آلي موثوق للوساطة الاستباقية لـ LLM عبر المجالات والتباينات الاجتماعية-المعرفية
MMAE: معيار ضخم متعدد المهام لتحرير الصوت
مصفوفة فك التضمين الخاصة بك هي سراً عدسة للميزات لتضمينات النص
ChordEdit: نقل أحادي الخطوة منخفض الطاقة لتحرير الصور
NitroGen: نموذج أساسي مفتوح للوكلاء اللاعبين العالميين
إعادة بناء الكائنات الديناميكية بكفاءة: دقة واحدة من D4RT في كل مرة
منصة التعلم المستمر: تقييم أنظمة الذكاء الاصطناعي المتطورة في بيئات عالمية واقعية ذات حالة
تخزين الذاكرة: الشبكات العصبية المتكررة (RNNs) ذات الذاكرة المتزايدة
RobotValues: تقييم الروبوتات المنزلية عندما تتعارض القيم البشرية
VideoKR: نحو فهم الفيديو كثيف المعرفة والاستدلال
AdaPlanBench: تقييم التخطيط التكيفي في agents النماذج اللغوية الكبيرة تحت قيود العالم والمستخدم
TIDE: اكتشاف استباقي متعدد المشكلات عبر التكرار الموجه بالقالب
ArcANE: هل يظل وكلاء اللغة Agents في لعب الأدوار في الشخصية في الوقت المناسب؟
Code2LoRA: المحولات المُولَّدة بواسطة الشبكة الفائقة لنماذج لغات البرمجة في ظل تطور البرمجيات
تدرج السياسة المُشتقّة ذاتياً
GSM-Symbolic: فهم قيود الاستدلال الرياضي في نماذج اللغات الكبيرة
CoVEBench: هل يمكن لنماذج تحرير الفيديو التعامل مع التعليمات المعقدة؟
الذاكرة المكانية الكامنة لنماذج العالم للفيديو
حول هندسة التقطير على السياسة
SWE-Explore: تقييم كيفية استكشاف وكلاء البرمجة Agents للمستودعات
تقرير تقني حول VoxCPM2
التقرير الفني الخاص بـ LongCat-Video-Avatar 1.5
ChartNet: مجموعة بيانات متعددة الوسائط عالية الجودة وذات مقياس يتجاوز المليون لفهم المخططات البيانية بشكل قوي
ACL-Verbatim: الإجابة على الأسئلة الخالية من الهلوسة في مجال البحث
ما وراء الحوارات الثابتة: تقييم ذاكرة طويلة المدى واقعية ومتباينة ومتطورة
نهاية هندسة البرمجيات: كيف تعمل وكلاء الذكاء الاصطناعي على إعادة هيكلة النموذج البرمجي بشكل جذري
لماذا تتعلم النماذج الأكبر بشكل أفضل: تأثيرات السعة، والتداخل، والاحتفاظ بالمهام النادرة
عندما تفشل الأدوات: تقييم المعايير لإعادة التخطيط الديناميكي والتعافي من الشذوذ في LLM Agents
الإدراج المباشر للكائنات الواعي بالثلاثي الأبعاد عبر الوكلاء البصريين المفككين
AnchorWorld: محاكاة العالم المتجسد الذاتي باستخدام تخصيص التطور القائم على المنظور
SoCRATES: نحو تقييم آلي موثوق للوساطة الاستباقية لـ LLM عبر المجالات والتباينات الاجتماعية-المعرفية
MMAE: معيار ضخم متعدد المهام لتحرير الصوت
مصفوفة فك التضمين الخاصة بك هي سراً عدسة للميزات لتضمينات النص
ChordEdit: نقل أحادي الخطوة منخفض الطاقة لتحرير الصور
NitroGen: نموذج أساسي مفتوح للوكلاء اللاعبين العالميين
إعادة بناء الكائنات الديناميكية بكفاءة: دقة واحدة من D4RT في كل مرة
منصة التعلم المستمر: تقييم أنظمة الذكاء الاصطناعي المتطورة في بيئات عالمية واقعية ذات حالة
تخزين الذاكرة: الشبكات العصبية المتكررة (RNNs) ذات الذاكرة المتزايدة
RobotValues: تقييم الروبوتات المنزلية عندما تتعارض القيم البشرية
VideoKR: نحو فهم الفيديو كثيف المعرفة والاستدلال
AdaPlanBench: تقييم التخطيط التكيفي في agents النماذج اللغوية الكبيرة تحت قيود العالم والمستخدم
TIDE: اكتشاف استباقي متعدد المشكلات عبر التكرار الموجه بالقالب
ArcANE: هل يظل وكلاء اللغة Agents في لعب الأدوار في الشخصية في الوقت المناسب؟
Code2LoRA: المحولات المُولَّدة بواسطة الشبكة الفائقة لنماذج لغات البرمجة في ظل تطور البرمجيات
تدرج السياسة المُشتقّة ذاتياً
GSM-Symbolic: فهم قيود الاستدلال الرياضي في نماذج اللغات الكبيرة