Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

POINTS-Reader: التكييف بدون تقطير للنماذج البصرية-اللغوية لتحويل المستندات

تركيب صور هندسية قابلة للتطبيق بشكل عام































POINTS-Reader: التكييف بدون تقطير للنماذج البصرية-اللغوية لتحويل المستندات

تركيب صور هندسية قابلة للتطبيق بشكل عام






























مزايا وسلبيات التعلم المعزز في التخطيط لنموذج اللغة: منظور نظري
تقدير تمكين وكالات النماذج اللغوية
يمكن للنماذج اللغوية أن تتعلم من الملاحظات اللفظية دون مكافآت قياسية
الاستدلال التغيري للنماذج اللغوية
تحسين السياسة المُنظم بالانتروبيا لوكالات نماذج اللغة الكبيرة التعلم المعزز
مَينِرU2.5: نموذج بصري-لغوي منفصل لتحليل الوثائق عالية الدقة بكفاءة
تقدير الميزة الكوانتيلية للتقييم الآمن للإنتروبيا
LongLive: توليد فيديو طويل تفاعلي في الزمن الحقيقي
الإبداع التوافقي: حدود جديدة في قدرات التعميم
التنبؤ السببي المكاني-الزمني: نهج متعدد الوسائط فعّال وكفؤ
هونيوان 3D-أومني: إطار موحد لإنشاء عناصر ثلاثية الأبعاد قابلة للتحكم
Seedream 4.0: نحو توليد الصور متعددة الوسائط الجيل التالي
بحث شجري للتعلم القوي لوكيل نموذج لغوي كبير
SciReasoner: وضع الأساس للتفكير العلمي عبر التخصصات
MMR1: تحسين التفكير متعدد الوسائط من خلال أخذ العينات المُدركة للتباين والمصادر المفتوحة
VCRL: التعلم التدريبي التشاركي القائم على التباين للنماذج اللغوية الكبيرة
MultiEdit: تطوير التحرير القائم على التعليم في الصور على مهام متنوعة وصعبة
بريسك: مجموعة بيانات مُعلَّمة لتقسيم وتصنيف الأورام الدماغية باستخدام شبكة سوين-هافنت
EmoBench-M: تقييم الذكاء العاطفي للنماذج اللغوية الكبيرة متعددة الوسائط
FDABench: معيار لوكالات البيانات في الاستعلامات التحليلية على البيانات غير الموحدة
رسم أيسر من التفكير: هل يمكن لنماذج النص إلى الصورة أن تُهيئ المسرح، لكنها لا تُوجِّه العرض؟
UniVerse-1: توليد الصوت والفيديو الموحّد من خلال خياطة الخبراء
ما مدى جودة النماذج الأساسية في الاستدلال الجسدي التدريجي؟
تقرير فني عن SpikingBrain: نماذج كبيرة مستوحاة من الدماغ العصبي من نوع Spiking
SAGE: معيار واقعي للفهم الدلالي
WAVECLIP: تجزئة الموجة لتوزيع متناسب للـ CLIP
إدراج جيمما: تمثيلات نصية قوية وخفيفة
تعزيز فهم الكلام في نماذج اللغة التي تأخذ بعين الاعتبار الكلام باستخدام GRPO
ما مدى بُعد النماذج اللسانيّة البصريّة عن الذكاء البصري المكاني؟ منظور مدفوع بالاختبارات
SIM-CoT: التفكير المتسلسل الضمني المُشرف عليه
مزايا وسلبيات التعلم المعزز في التخطيط لنموذج اللغة: منظور نظري
تقدير تمكين وكالات النماذج اللغوية
يمكن للنماذج اللغوية أن تتعلم من الملاحظات اللفظية دون مكافآت قياسية
الاستدلال التغيري للنماذج اللغوية
تحسين السياسة المُنظم بالانتروبيا لوكالات نماذج اللغة الكبيرة التعلم المعزز
مَينِرU2.5: نموذج بصري-لغوي منفصل لتحليل الوثائق عالية الدقة بكفاءة
تقدير الميزة الكوانتيلية للتقييم الآمن للإنتروبيا
LongLive: توليد فيديو طويل تفاعلي في الزمن الحقيقي
الإبداع التوافقي: حدود جديدة في قدرات التعميم
التنبؤ السببي المكاني-الزمني: نهج متعدد الوسائط فعّال وكفؤ
هونيوان 3D-أومني: إطار موحد لإنشاء عناصر ثلاثية الأبعاد قابلة للتحكم
Seedream 4.0: نحو توليد الصور متعددة الوسائط الجيل التالي
بحث شجري للتعلم القوي لوكيل نموذج لغوي كبير
SciReasoner: وضع الأساس للتفكير العلمي عبر التخصصات
MMR1: تحسين التفكير متعدد الوسائط من خلال أخذ العينات المُدركة للتباين والمصادر المفتوحة
VCRL: التعلم التدريبي التشاركي القائم على التباين للنماذج اللغوية الكبيرة
MultiEdit: تطوير التحرير القائم على التعليم في الصور على مهام متنوعة وصعبة
بريسك: مجموعة بيانات مُعلَّمة لتقسيم وتصنيف الأورام الدماغية باستخدام شبكة سوين-هافنت
EmoBench-M: تقييم الذكاء العاطفي للنماذج اللغوية الكبيرة متعددة الوسائط
FDABench: معيار لوكالات البيانات في الاستعلامات التحليلية على البيانات غير الموحدة
رسم أيسر من التفكير: هل يمكن لنماذج النص إلى الصورة أن تُهيئ المسرح، لكنها لا تُوجِّه العرض؟
UniVerse-1: توليد الصوت والفيديو الموحّد من خلال خياطة الخبراء
ما مدى جودة النماذج الأساسية في الاستدلال الجسدي التدريجي؟
تقرير فني عن SpikingBrain: نماذج كبيرة مستوحاة من الدماغ العصبي من نوع Spiking
SAGE: معيار واقعي للفهم الدلالي
WAVECLIP: تجزئة الموجة لتوزيع متناسب للـ CLIP
إدراج جيمما: تمثيلات نصية قوية وخفيفة
تعزيز فهم الكلام في نماذج اللغة التي تأخذ بعين الاعتبار الكلام باستخدام GRPO
ما مدى بُعد النماذج اللسانيّة البصريّة عن الذكاء البصري المكاني؟ منظور مدفوع بالاختبارات
SIM-CoT: التفكير المتسلسل الضمني المُشرف عليه