Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

تدفق SAC: تعلم التحكم المُعزَّز الفعّال بالعينة لسياسات القنوات القائمة على التدفق من خلال النمذجة التسلسلية مع إعادة تعيين السرعة

هجمات عدائية ضد نماذج التعلم الآلي الكبيرة المغلقة المصدر من خلال المحاذاة المثلى للسمات































تدفق SAC: تعلم التحكم المُعزَّز الفعّال بالعينة لسياسات القنوات القائمة على التدفق من خلال النمذجة التسلسلية مع إعادة تعيين السرعة

هجمات عدائية ضد نماذج التعلم الآلي الكبيرة المغلقة المصدر من خلال المحاذاة المثلى للسمات






























هيل تو ذا ثيف: استكشاف الهجمات والدفاعات في GRPO اللامركزية
استخلاص نموذج لغوي كبير ذاتيّ التقييد من نوع مغلق على سياسة محددة
UniVA: وكيل فيديو عالمي نحو عامِّل فيديو من الجيل التالي مفتوح المصدر
PAN: نموذج عالمي للمحاكاة العامة والقابلة للتفاعل وعالية الطول الزمني للعالم
خطوة صغيرة في الفضاء الخفي، وقفزة ضخمة للبكسلات: مُعدّل تكبير سريع للفراغ الخفي لنماذج التفتيت الخاصة بك
يولو في 13: الكشف عن الكائنات في الزمن الحقيقي مع تحسين الرؤية البصرية التكيفية باستخدام الرسم البياني الفائق
MonkeyOCR: تحليل المستندات باستخدام نموذج ثلاثي الهيكل-التمييز-العلاقة
ال샘جة المتفق عليها لذكاء اصطناعي توليدي آمن أكثر
أرجوس: إطار ضمان السلامة مُوجّه نحو المرونة للأنظمة الذاتية للقيادة من الطرف إلى الطرف
WMPO: تحسين السياسة القائمة على النموذج العالمي للنماذج البصرية-اللغوية-العملية
LoopTool: إغلاق دورة البيانات-التدريب لاستدعاءات الأدوات القوية للنماذج اللغوية الكبيرة
ما وراء استرجاع الحقائق: الذاكرة السردية لـ RAG مع الفضاءات الشكلية التوليدية
TiDAR: تفكير في التباعد، كلام في الانحدار التلقائي
زمن الحركة: توليد فيديو متحكم به حركي دون تدريب عبر إزالة الضوضاء ذات الساعة المزدوجة
لومين: وصفة مفتوحة لبناء وكالات عامة في عوالم مفتوحة ثلاثية الأبعاد
إنشاء صورة من 1000 كلمة: تحسين التوليد النصي إلى الصورة باستخدام عناوين منظمة
KLASS: استنتاج سريع موجه بـ KL في نماذج الت(diffusion) المقنعة
تثبيت وكالات استخدام الحاسوب على التمثيل البشري
وسم: نموذج لبناء مجموعات نصية متعددة الوسائط منظمة مُتداخلة بالعربية
تحسين الاستجابة متعددة الوكلاء التكيفية في الأنظمة الحوارية
SPAN: التوافق المكاني-الإسقاطي للكشف عن الكائنات ثلاثية الأبعاد من منظور واحد
التقريب الفعّال لسلسلة فولتيرا للأنظمة عالية الأبعاد
SofT-GRPO: تفوق التعلم بالتحفيز للنماذج اللغوية الكبيرة ذات الرموز المنفصلة من خلال تحسين السياسة بالتفكير اللين المعاد صياغته باستخدام جومبل
ريد원 2.0: إعادة التفكير في التدريب اللاحق للنماذج اللغوية الكبيرة المخصصة للمجالات في خدمات الشبكات الاجتماعية
المحطّة: بيئة عالم مفتوح للاكتشاف المُشَغّل بالذكاء الاصطناعي
DRIVE: أفضل الممارسات لتنظيف البيانات للتعلم القوي مع مكافأة قابلة للتحقق في توليد الشفرة التنافسية
IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية
HaluMem: تقييم التخيلات في أنظمة الذاكرة للوكلاء
GVPO: تحسين سياسة التباين المجموعة للتدريب اللاحق لنموذج اللغة الكبير
ReCA: تسريع متكامل للوكالات الذاتية المدمجة التعاونية في الزمن الحقيقي والفعّالة
هيل تو ذا ثيف: استكشاف الهجمات والدفاعات في GRPO اللامركزية
استخلاص نموذج لغوي كبير ذاتيّ التقييد من نوع مغلق على سياسة محددة
UniVA: وكيل فيديو عالمي نحو عامِّل فيديو من الجيل التالي مفتوح المصدر
PAN: نموذج عالمي للمحاكاة العامة والقابلة للتفاعل وعالية الطول الزمني للعالم
خطوة صغيرة في الفضاء الخفي، وقفزة ضخمة للبكسلات: مُعدّل تكبير سريع للفراغ الخفي لنماذج التفتيت الخاصة بك
يولو في 13: الكشف عن الكائنات في الزمن الحقيقي مع تحسين الرؤية البصرية التكيفية باستخدام الرسم البياني الفائق
MonkeyOCR: تحليل المستندات باستخدام نموذج ثلاثي الهيكل-التمييز-العلاقة
ال샘جة المتفق عليها لذكاء اصطناعي توليدي آمن أكثر
أرجوس: إطار ضمان السلامة مُوجّه نحو المرونة للأنظمة الذاتية للقيادة من الطرف إلى الطرف
WMPO: تحسين السياسة القائمة على النموذج العالمي للنماذج البصرية-اللغوية-العملية
LoopTool: إغلاق دورة البيانات-التدريب لاستدعاءات الأدوات القوية للنماذج اللغوية الكبيرة
ما وراء استرجاع الحقائق: الذاكرة السردية لـ RAG مع الفضاءات الشكلية التوليدية
TiDAR: تفكير في التباعد، كلام في الانحدار التلقائي
زمن الحركة: توليد فيديو متحكم به حركي دون تدريب عبر إزالة الضوضاء ذات الساعة المزدوجة
لومين: وصفة مفتوحة لبناء وكالات عامة في عوالم مفتوحة ثلاثية الأبعاد
إنشاء صورة من 1000 كلمة: تحسين التوليد النصي إلى الصورة باستخدام عناوين منظمة
KLASS: استنتاج سريع موجه بـ KL في نماذج الت(diffusion) المقنعة
تثبيت وكالات استخدام الحاسوب على التمثيل البشري
وسم: نموذج لبناء مجموعات نصية متعددة الوسائط منظمة مُتداخلة بالعربية
تحسين الاستجابة متعددة الوكلاء التكيفية في الأنظمة الحوارية
SPAN: التوافق المكاني-الإسقاطي للكشف عن الكائنات ثلاثية الأبعاد من منظور واحد
التقريب الفعّال لسلسلة فولتيرا للأنظمة عالية الأبعاد
SofT-GRPO: تفوق التعلم بالتحفيز للنماذج اللغوية الكبيرة ذات الرموز المنفصلة من خلال تحسين السياسة بالتفكير اللين المعاد صياغته باستخدام جومبل
ريد원 2.0: إعادة التفكير في التدريب اللاحق للنماذج اللغوية الكبيرة المخصصة للمجالات في خدمات الشبكات الاجتماعية
المحطّة: بيئة عالم مفتوح للاكتشاف المُشَغّل بالذكاء الاصطناعي
DRIVE: أفضل الممارسات لتنظيف البيانات للتعلم القوي مع مكافأة قابلة للتحقق في توليد الشفرة التنافسية
IterResearch: إعادة التفكير في الوكلاء ذوي الأفق الطويل من خلال إعادة بناء الحالة ماركوفية
HaluMem: تقييم التخيلات في أنظمة الذاكرة للوكلاء
GVPO: تحسين سياسة التباين المجموعة للتدريب اللاحق لنموذج اللغة الكبير
ReCA: تسريع متكامل للوكالات الذاتية المدمجة التعاونية في الزمن الحقيقي والفعّالة