Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

MCP-Cosmos: وكلاء معززون بنموذج عالمي لتنفيذ المهام المعقدة في بيئات MCP

ما وراء الاستدلال: التعلم التعزيزي يفتح المعرفة البارامترية في نماذج اللغات الكبيرة































MCP-Cosmos: وكلاء معززون بنموذج عالمي لتنفيذ المهام المعقدة في بيئات MCP

ما وراء الاستدلال: التعلم التعزيزي يفتح المعرفة البارامترية في نماذج اللغات الكبيرة






























تمثيلات قائمة على النموذج خالية من التحيز للتحكم المستمر الفعال من حيث العينات
نماذج لغوية كبيرة متعددة التدفقات: إزالة عوائق النماذج اللغوية باستخدام تدفقات متوازية من الأفكار، والمدخلات والمخرجات
نموذج لغتك هو ناقد نفسه: التعلم التعزيزي مع تقدير القيمة من الحالات الداخلية للممثل
ريليت-لايف: إعادة إضاءة الفيديو من خلال التعلم المشترك لفيديو البيئة
المحاذاة الإيجابية: الذكاء الاصطناعي ازدهار الإنسان
LLaVA-UHD v4: ما الذي يجعل الترميز البصري الفعال في نماذج اللغات متعددة الوسائط الكبرى (MLLMs)؟
كشف التلطخ غير السياسي: أين يساعد، وأين يضر، ولماذا
عصبون واحد يكفي لتجاوز مواءمة الأمان في النماذج اللغوية الكبيرة
SlimQwen: استكشاف الضبط والتقطيع في التدريب المسبق لنموذج MoE الكبير
إي إل إف: تدفقات اللغات المضمنة
PaperFit: تحسين تنسيق المستندات العلمية باستخدام الرؤية ضمن الحلقة
التقطير القائم على السياسة باستخدام معايير التقييم
CollabVR: الاستدلال التعاوني عبر الفيديو باستخدام نماذج رؤية-لغة وتوليد الفيديو
تيماس: توسيع الحساب أثناء الاختبار من خلال تعاضد الوكلاء
سوهاك: معيار من وضع خبراء الرياضيات لتقييم قدرات النماذج اللغوية الكبيرة في حل المسائل الرياضية على مستوى البحث العلمي
تقرير تقني حول Qwen-Image-2.0
MiniCPM-o 4.5: نحو تفاعل شمولي متعدد الوسائط في الوقت الحقيقي وبشكل ثنائي الاتجاه
التعلم أثناء النشر: تعزيز تقني مدعوم بالتعلّم المعزز على نطاق الأسطول لسياسات الروبوتات الشاملة
محول اللافتات السريعة للبايت
الرياضياتي المساعد بالذكاء الاصطناعي: تسريع عمل الرياضيين باستخدام الذكاء الاصطناعي الوكيل (Agentic AI)
HyperEyes: تعزيز الكفاءة الثنائية الحبيبات باستخدام التعلم التعزيزي الواعي بالفعالية في وكلاء البحث متعدد الوسائط المتوازيين
صرخات النمط المتوسط: فصل التباين-المتوسط للمتبقيات في نماذج التحويل الانتشارية ذات الطبقات الألف
تحسين نماذج اللغات الكبيرة (LLMs) لنماذج اللغات الكبيرة: اكتشاف وكيل للتوسع أثناء الاختبار
تحسين السياسة على مستوى القوائم: تعزيز التعلم المعزز القائم على المجموعة كإسقاط الهدف على سيمبلكس استجابة النموذج اللغوي الكبير
Flow-OPD: تقطير على السياسة لنماذج مطابقة التدفق
MACE-Dance: خبراء متسلسلون للحركة والمظهر لتوليد مقاطع فيديو للرقص المستندة إلى الموسيقى
إعادة التفكير في الاسترجاع المكثف للاستدلال: تقييم وتطوير أنظمة الاسترجاع في أنظمة البحث الوكيلية
متى نثق بالخيال: تنفيذ الإجراءات التكيفية لنماذج العالم والإجراءات
RaguTeam في مهمة 8 من SemEval-2026: Meno والأصدقاء في مجموعة LLM orchestrated بالقاضي من أجل توليد ردود متعددة المراحل بموثوقية عالية
MiA-Signature: تقريب التفعيل العالمي للفهم طويل المدى
تمثيلات قائمة على النموذج خالية من التحيز للتحكم المستمر الفعال من حيث العينات
نماذج لغوية كبيرة متعددة التدفقات: إزالة عوائق النماذج اللغوية باستخدام تدفقات متوازية من الأفكار، والمدخلات والمخرجات
نموذج لغتك هو ناقد نفسه: التعلم التعزيزي مع تقدير القيمة من الحالات الداخلية للممثل
ريليت-لايف: إعادة إضاءة الفيديو من خلال التعلم المشترك لفيديو البيئة
المحاذاة الإيجابية: الذكاء الاصطناعي ازدهار الإنسان
LLaVA-UHD v4: ما الذي يجعل الترميز البصري الفعال في نماذج اللغات متعددة الوسائط الكبرى (MLLMs)؟
كشف التلطخ غير السياسي: أين يساعد، وأين يضر، ولماذا
عصبون واحد يكفي لتجاوز مواءمة الأمان في النماذج اللغوية الكبيرة
SlimQwen: استكشاف الضبط والتقطيع في التدريب المسبق لنموذج MoE الكبير
إي إل إف: تدفقات اللغات المضمنة
PaperFit: تحسين تنسيق المستندات العلمية باستخدام الرؤية ضمن الحلقة
التقطير القائم على السياسة باستخدام معايير التقييم
CollabVR: الاستدلال التعاوني عبر الفيديو باستخدام نماذج رؤية-لغة وتوليد الفيديو
تيماس: توسيع الحساب أثناء الاختبار من خلال تعاضد الوكلاء
سوهاك: معيار من وضع خبراء الرياضيات لتقييم قدرات النماذج اللغوية الكبيرة في حل المسائل الرياضية على مستوى البحث العلمي
تقرير تقني حول Qwen-Image-2.0
MiniCPM-o 4.5: نحو تفاعل شمولي متعدد الوسائط في الوقت الحقيقي وبشكل ثنائي الاتجاه
التعلم أثناء النشر: تعزيز تقني مدعوم بالتعلّم المعزز على نطاق الأسطول لسياسات الروبوتات الشاملة
محول اللافتات السريعة للبايت
الرياضياتي المساعد بالذكاء الاصطناعي: تسريع عمل الرياضيين باستخدام الذكاء الاصطناعي الوكيل (Agentic AI)
HyperEyes: تعزيز الكفاءة الثنائية الحبيبات باستخدام التعلم التعزيزي الواعي بالفعالية في وكلاء البحث متعدد الوسائط المتوازيين
صرخات النمط المتوسط: فصل التباين-المتوسط للمتبقيات في نماذج التحويل الانتشارية ذات الطبقات الألف
تحسين نماذج اللغات الكبيرة (LLMs) لنماذج اللغات الكبيرة: اكتشاف وكيل للتوسع أثناء الاختبار
تحسين السياسة على مستوى القوائم: تعزيز التعلم المعزز القائم على المجموعة كإسقاط الهدف على سيمبلكس استجابة النموذج اللغوي الكبير
Flow-OPD: تقطير على السياسة لنماذج مطابقة التدفق
MACE-Dance: خبراء متسلسلون للحركة والمظهر لتوليد مقاطع فيديو للرقص المستندة إلى الموسيقى
إعادة التفكير في الاسترجاع المكثف للاستدلال: تقييم وتطوير أنظمة الاسترجاع في أنظمة البحث الوكيلية
متى نثق بالخيال: تنفيذ الإجراءات التكيفية لنماذج العالم والإجراءات
RaguTeam في مهمة 8 من SemEval-2026: Meno والأصدقاء في مجموعة LLM orchestrated بالقاضي من أجل توليد ردود متعددة المراحل بموثوقية عالية
MiA-Signature: تقريب التفعيل العالمي للفهم طويل المدى