Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

توسيع حسابات وقت الاختبار للوكلاء ذوي النماذج اللغوية الكبيرة (LLM)

TaskCraft: التوليد الآلي للمهام الوكيلة































توسيع حسابات وقت الاختبار للوكلاء ذوي النماذج اللغوية الكبيرة (LLM)

TaskCraft: التوليد الآلي للمهام الوكيلة






























انتظر، لا نحتاج إلى "الانتظار"! إزالة رموز التفكير تحسن كفاءة الاستدلال
Ego-R1: سلسلة التفكير بالأدوات لمنطق الفيديو الذاتي المطول للغاية
DeepResearch Bench: معيار شامل لمُحفزات البحث العميق
اختبار العلماء الأول: استكشاف القدرات المعرفية للنماذج اللغوية الكبيرة المتعددة عبر الإدراك والفهم والاستدلال
مينيماكس-م1: توسيع الحوسبة الفعالة في وقت الاختبار باستخدام انتباه البرق
تجاوز الانتباه المتجانس: نماذج اللغة الكبيرة ذات الكفاءة العالية في الذاكرة من خلال تخزين Fourier التقريبي للقيم والمفاتيح (KV)
مجموعة بيانات عالية الجودة وتقييم موثوق به لتقنيات التوليد المتشابكة للصورة والنص
SwS: التركيب الذاتي للمشكلات المستندة إلى الضعف في التعلم التعزيزي لمنطق النماذج اللغوية الكبيرة
LiveCodeBench Pro: كيف يقيم أولمبياد الميداليات النموذجية نماذج اللغات الطبيعية في البرمجة التنافسية؟
ثنائية الانتشار
الصورة والهندسة من وجهة نظر جديدة محاذاة عبر تثبيت الانتباه العابر للنماذج
VRBench: معيار للاستدلال متعدد الخطوات في مقاطع الفيديو нарративной الطويلة
AniMaker: السرد المتحرك الآلي متعدد الوكلاء مع إنشاء مقاطع بواسطة MCTS
استعادة الصور مع نماذج التوسع المعتمدة على النص
ماجستريال
SWE-Factory: مصنعك الآلي لبيانات تدريب حل المشكلات ومقاييس التقييم
ReasonMed: مجموعة بيانات متعددة الوكلاء بحجم 370K لتطوير الاستدلال الطبي
سابيينس: الأساس لنماذج الرؤية البشرية
LongVILA: توسيع النماذج اللغوية البصرية ذات السياق الطويل للفيديوهات الطويلة
SAM 2: التجزئة في الصور والفيديوهات
مجموعة نماذج لامات 3
InternLM-XComposer-2.5: نموذج لغوي بصري كبير متعدد الاستخدامات يدعم الإدخال والإخراج الطويلان.
MMDU: معيار فهم المحادثة متعددة الجولات ومتعددة الصور ومجموعة بيانات لتنضيد التعليم للنماذج متعددة الوسائط ذات التوسع الكبير
ما الذي يهم عند بناء نماذج الرؤية واللغة؟
DDOS: مجموعة بيانات التصنيف العميق للطائرات المُسيرة وتحديد العوائق
النماذج التلقائية الانحدارية مقابل النماذج المطابقة للتدفق: دراسة مقارنة لتقنيات توليد الموسيقى من النص
SeerAttention-R: تكيف الانتباه النادر للمنطق الطويل
PlayerOne: محاكِّي العالم المتمركز حول الذات
ComfyUI-R1: استكشاف نماذج الاستدلال لتكوين سير العمل
التدريب المعاكس التلقائي للشبكات العصبية للإنتاج الفيديوي التفاعلي في الوقت الحقيقي
انتظر، لا نحتاج إلى "الانتظار"! إزالة رموز التفكير تحسن كفاءة الاستدلال
Ego-R1: سلسلة التفكير بالأدوات لمنطق الفيديو الذاتي المطول للغاية
DeepResearch Bench: معيار شامل لمُحفزات البحث العميق
اختبار العلماء الأول: استكشاف القدرات المعرفية للنماذج اللغوية الكبيرة المتعددة عبر الإدراك والفهم والاستدلال
مينيماكس-م1: توسيع الحوسبة الفعالة في وقت الاختبار باستخدام انتباه البرق
تجاوز الانتباه المتجانس: نماذج اللغة الكبيرة ذات الكفاءة العالية في الذاكرة من خلال تخزين Fourier التقريبي للقيم والمفاتيح (KV)
مجموعة بيانات عالية الجودة وتقييم موثوق به لتقنيات التوليد المتشابكة للصورة والنص
SwS: التركيب الذاتي للمشكلات المستندة إلى الضعف في التعلم التعزيزي لمنطق النماذج اللغوية الكبيرة
LiveCodeBench Pro: كيف يقيم أولمبياد الميداليات النموذجية نماذج اللغات الطبيعية في البرمجة التنافسية؟
ثنائية الانتشار
الصورة والهندسة من وجهة نظر جديدة محاذاة عبر تثبيت الانتباه العابر للنماذج
VRBench: معيار للاستدلال متعدد الخطوات في مقاطع الفيديو нарративной الطويلة
AniMaker: السرد المتحرك الآلي متعدد الوكلاء مع إنشاء مقاطع بواسطة MCTS
استعادة الصور مع نماذج التوسع المعتمدة على النص
ماجستريال
SWE-Factory: مصنعك الآلي لبيانات تدريب حل المشكلات ومقاييس التقييم
ReasonMed: مجموعة بيانات متعددة الوكلاء بحجم 370K لتطوير الاستدلال الطبي
سابيينس: الأساس لنماذج الرؤية البشرية
LongVILA: توسيع النماذج اللغوية البصرية ذات السياق الطويل للفيديوهات الطويلة
SAM 2: التجزئة في الصور والفيديوهات
مجموعة نماذج لامات 3
InternLM-XComposer-2.5: نموذج لغوي بصري كبير متعدد الاستخدامات يدعم الإدخال والإخراج الطويلان.
MMDU: معيار فهم المحادثة متعددة الجولات ومتعددة الصور ومجموعة بيانات لتنضيد التعليم للنماذج متعددة الوسائط ذات التوسع الكبير
ما الذي يهم عند بناء نماذج الرؤية واللغة؟
DDOS: مجموعة بيانات التصنيف العميق للطائرات المُسيرة وتحديد العوائق
النماذج التلقائية الانحدارية مقابل النماذج المطابقة للتدفق: دراسة مقارنة لتقنيات توليد الموسيقى من النص
SeerAttention-R: تكيف الانتباه النادر للمنطق الطويل
PlayerOne: محاكِّي العالم المتمركز حول الذات
ComfyUI-R1: استكشاف نماذج الاستدلال لتكوين سير العمل
التدريب المعاكس التلقائي للشبكات العصبية للإنتاج الفيديوي التفاعلي في الوقت الحقيقي