Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

ديب سيك ر1 ثيودولوجي: دعونا نفكر في الاستدلال لدى نماذج اللغة الكبيرة

التكامل متعدد المفاهيم مع الانتشار ثنائي المحور لتمثيل المفاهيم الطبية































ديب سيك ر1 ثيودولوجي: دعونا نفكر في الاستدلال لدى نماذج اللغة الكبيرة

التكامل متعدد المفاهيم مع الانتشار ثنائي المحور لتمثيل المفاهيم الطبية






























كشف المشكلات السريرية التلقائي من ملاحظات SOAP باستخدام بنية متعددة الوكلاء المتعاونة المستندة إلى نموذج لغوي كبير
سمولدوكلينج: نموذج رؤية ولغة شديد الصغر لتحويل الوثائق متعددة الوسائط من البداية إلى النهاية
olmOCR: فتح تريليونات الرموز في ملفات PDF باستخدام نماذج اللغة والرؤية
VA-MoE: متغيرات-مُعدّلة مزيج من الخبراء للتنبؤ بالطقس التدريجي
HuatuoGPT-Vision، نحو دمج المعرفة البصرية الطبية في النماذج اللغوية متعددة الوسائط على نطاق واسع
كيف يمكن لإعادة صياغة المدخلات تحسين دقة استخدام الأدوات في بيئة ديناميكية معقدة؟ دراسة على مجموعة بيانات τ-bench
التقييم على مستوى واجهة المستخدم لـ ALLaM 34B: قياس نموذج لغوي كبير متمحور حول العربية من خلال محادثة HUMAIN
من التفاعلية إلى الإدراكية: ذكاء فضائي مُلهم من الدماغ للوكالات المادية
لا تترك علامة وراء: نموذج موحد للكشف عن العيوب السطحية لجميع أنماط الإشراف
T2R-bench: معيار لتوليد تقارير على مستوى المقال من الجداول الصناعية الواقعية
PVPO: تحسين السياسة القائمة على القيمة المقدّرة مسبقًا للتفكير الوكلي
تدريب مساعد مفيد وآمن باستخدام التعلم المعزز من التغذية الراجعة البشرية
تقييم نماذج اللغة على الأسئلة غير المحلولة
كارجان: توليد ومحاكاة سيناريوهات المرور القائمة على الوكيل باستخدام جان
TiKMiX: أخذ تأثير البيانات في الاحتمال الديناميكي للمزيج لتدريب النموذج اللغوي
TalkVid: مجموعة بيانات كبيرة ومتنوعة لمحاكاة رأس يتحدث يُتحكم به الصوت
Droplet3D: الاحتمالات البديهية من الفيديوهات تُسهّل التوليد ثلاثي الأبعاد
A.S.E: معيار على مستوى المستودع لتقييم الأمان في التعليمات البرمجية المولدة بواسطة الذكاء الاصطناعي
EmbodiedOneVision: التدريب المتناوب للرؤية والنص والعمل لتحكم عام في الروبوتات
R-4B: تحفيز القدرة التلقائية العامة في النماذج الكبيرة متعددة الوسائط من خلال التبريد الثنائي والتعلم التعزيزي
إشعال الكتابة الإبداعية في النماذج الصغيرة للغة: نموذج لغة كبير كقاضٍ مقابل المكافآت المُحسَّنة متعددة الوكالات
TMUAD: تعزيز القدرات المنطقية في نماذج الكشف الموحدة عن الشذوذ باستخدام مخزن ذاكرة نصية
تحليل ديناميكيات التفكير المتسلسل: توجيه نشط أم تبرير عكسي غير موثوق؟
أوورلد: تنسيق وصفة التدريب للذكاء الاصطناعي الوظيفي
MCP-Bench: أداة تقييم لوكالات نماذج اللغة الكبيرة التي تستخدم الأدوات بمهمات واقعية معقدة من خلال خوادم MCP
تقرير تقني للتفكير الوظيفي rStar2-Agent
Pref-GRPO: GRPO المستند إلى مكافأة التفضيل الزوجي للتعلم المعزز الثابت من النص إلى الصورة
MobileCLIP2: تحسين التدريب المتعدد الوسائط المعزز
تَعاون جمالي بين الذكاء الاصطناعي والذكاء الاصطناعي مع إدراك صريح للدلالة وتطوير قواعد لغوية ناشئة
انظر إلى القلب: مجموعة بيانات فيديو متعددة الزوايا لتقدير rPPG وعوامل الحالة الصحية
كشف المشكلات السريرية التلقائي من ملاحظات SOAP باستخدام بنية متعددة الوكلاء المتعاونة المستندة إلى نموذج لغوي كبير
سمولدوكلينج: نموذج رؤية ولغة شديد الصغر لتحويل الوثائق متعددة الوسائط من البداية إلى النهاية
olmOCR: فتح تريليونات الرموز في ملفات PDF باستخدام نماذج اللغة والرؤية
VA-MoE: متغيرات-مُعدّلة مزيج من الخبراء للتنبؤ بالطقس التدريجي
HuatuoGPT-Vision، نحو دمج المعرفة البصرية الطبية في النماذج اللغوية متعددة الوسائط على نطاق واسع
كيف يمكن لإعادة صياغة المدخلات تحسين دقة استخدام الأدوات في بيئة ديناميكية معقدة؟ دراسة على مجموعة بيانات τ-bench
التقييم على مستوى واجهة المستخدم لـ ALLaM 34B: قياس نموذج لغوي كبير متمحور حول العربية من خلال محادثة HUMAIN
من التفاعلية إلى الإدراكية: ذكاء فضائي مُلهم من الدماغ للوكالات المادية
لا تترك علامة وراء: نموذج موحد للكشف عن العيوب السطحية لجميع أنماط الإشراف
T2R-bench: معيار لتوليد تقارير على مستوى المقال من الجداول الصناعية الواقعية
PVPO: تحسين السياسة القائمة على القيمة المقدّرة مسبقًا للتفكير الوكلي
تدريب مساعد مفيد وآمن باستخدام التعلم المعزز من التغذية الراجعة البشرية
تقييم نماذج اللغة على الأسئلة غير المحلولة
كارجان: توليد ومحاكاة سيناريوهات المرور القائمة على الوكيل باستخدام جان
TiKMiX: أخذ تأثير البيانات في الاحتمال الديناميكي للمزيج لتدريب النموذج اللغوي
TalkVid: مجموعة بيانات كبيرة ومتنوعة لمحاكاة رأس يتحدث يُتحكم به الصوت
Droplet3D: الاحتمالات البديهية من الفيديوهات تُسهّل التوليد ثلاثي الأبعاد
A.S.E: معيار على مستوى المستودع لتقييم الأمان في التعليمات البرمجية المولدة بواسطة الذكاء الاصطناعي
EmbodiedOneVision: التدريب المتناوب للرؤية والنص والعمل لتحكم عام في الروبوتات
R-4B: تحفيز القدرة التلقائية العامة في النماذج الكبيرة متعددة الوسائط من خلال التبريد الثنائي والتعلم التعزيزي
إشعال الكتابة الإبداعية في النماذج الصغيرة للغة: نموذج لغة كبير كقاضٍ مقابل المكافآت المُحسَّنة متعددة الوكالات
TMUAD: تعزيز القدرات المنطقية في نماذج الكشف الموحدة عن الشذوذ باستخدام مخزن ذاكرة نصية
تحليل ديناميكيات التفكير المتسلسل: توجيه نشط أم تبرير عكسي غير موثوق؟
أوورلد: تنسيق وصفة التدريب للذكاء الاصطناعي الوظيفي
MCP-Bench: أداة تقييم لوكالات نماذج اللغة الكبيرة التي تستخدم الأدوات بمهمات واقعية معقدة من خلال خوادم MCP
تقرير تقني للتفكير الوظيفي rStar2-Agent
Pref-GRPO: GRPO المستند إلى مكافأة التفضيل الزوجي للتعلم المعزز الثابت من النص إلى الصورة
MobileCLIP2: تحسين التدريب المتعدد الوسائط المعزز
تَعاون جمالي بين الذكاء الاصطناعي والذكاء الاصطناعي مع إدراك صريح للدلالة وتطوير قواعد لغوية ناشئة
انظر إلى القلب: مجموعة بيانات فيديو متعددة الزوايا لتقدير rPPG وعوامل الحالة الصحية