Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

تحسين مزيج الانتباه الكتلي

FractalForensics: الكشف المُبكر عن المُزيف العميق وتحديد موضعه من خلال الطُرُق التكرارية































تحسين مزيج الانتباه الكتلي

FractalForensics: الكشف المُبكر عن المُزيف العميق وتحديد موضعه من خلال الطُرُق التكرارية






























الاستيلاء على السلسلة التفكيرية
InstanceAssemble: توليد صور يراعي التخطيط من خلال انتباه تجميع المثيلات
3EED: تأسيس كل شيء في كل مكان في الأبعاد الثلاثة
ديتكتيوم فاير: مجموعة بيانات متعددة الوسائط شاملة تربط بين الرؤية واللغة لفهم الحريق
CHIP: مجموعة بيانات متعددة الحساسات لتقدير الوضعية الستة أبعاد للكراسي في البيئات الصناعية
وكيل مُقيَّد هندسيًا للاستدلال المكاني
ديب سيك-ف3.2: دفع حدود النماذج اللغوية الكبيرة المفتوحة
DiP: تَسْكِين النماذج التفاضلية في فضاء البكسل
عدم تفكيك البنية لا يكفي وحده لتحقيق نموذج متعدد الوسائط موحد
الج pont المُرَبِّط بالرؤية على نطاق واسع
AnyTalker: توسيع إنشاء مقاطع فيديو متعددة الأشخاص يتحدثون مع تحسين التفاعل
REASONEDIT: نحو نماذج تحرير الصور المعززة بالاستدلال
OpenApps: محاكاة التغيرات البيئية لقياس موثوقية واجهة المستخدم-الوكيل
تقرير تقني عن Qwen3-VL
G2VLM: نموذج رؤية ولغة مُوجَّهٌ بالهندسة مع إعادة بناء ثلاثية الأبعاد الموحَّدة والاستدلال المكاني
متعدد المعايير: تقييم المحكمين متعددي الوسائط وفقًا لمعايير متعددة
ميرا: وكيل الاستدلال التكراري متعدد الوسائط للتعديل الصوتي
ENACT: تقييم الذكاء المُشَكَّل باستخدام نمذجة العالم للتفاعل من منظور الشخص الأول
الرسمة إلى الصورة: توليد صور مركبة باستخدام تحكم متعدد الوسائط
نماذج توليد الفيديو جيدة كنماذج مكافأة ذاتية مخفية
ديب سيك ماث فاير: نحو الاستنتاج الرياضي ذاتي التحقق
ToolOrchestra: رفع مستوى الذكاء من خلال تنسيق فعّال للنماذج والأدوات
فكّر بصريًا، وتفنّن نصيًا: التآزر بين الرؤية واللغة في ARC
هارموني: مزج إنشاء الصوت والفيديو من خلال التآزر بين المهام المختلفة
إنفيريكس: محرك استنتاج من الجيل التالي مبني على التمايز الكتلي للنماذج العالمية للمحاكاة
التعاون الضمني في الأنظمة متعددة الوكلاء
التقييم متعدد الوسائط للهياكل اللغوية الروسية
جذر: مُحسِّن مُتَوَزَّنٌ مُتَمَيِّزٌ لتدريب الشبكات العصبية
يُنتج التراكب مقياسًا عصبيًا قويًا
أفضل حدود الأخطاء المثلى لتعلم آليات التحويل التتابعي
الاستيلاء على السلسلة التفكيرية
InstanceAssemble: توليد صور يراعي التخطيط من خلال انتباه تجميع المثيلات
3EED: تأسيس كل شيء في كل مكان في الأبعاد الثلاثة
ديتكتيوم فاير: مجموعة بيانات متعددة الوسائط شاملة تربط بين الرؤية واللغة لفهم الحريق
CHIP: مجموعة بيانات متعددة الحساسات لتقدير الوضعية الستة أبعاد للكراسي في البيئات الصناعية
وكيل مُقيَّد هندسيًا للاستدلال المكاني
ديب سيك-ف3.2: دفع حدود النماذج اللغوية الكبيرة المفتوحة
DiP: تَسْكِين النماذج التفاضلية في فضاء البكسل
عدم تفكيك البنية لا يكفي وحده لتحقيق نموذج متعدد الوسائط موحد
الج pont المُرَبِّط بالرؤية على نطاق واسع
AnyTalker: توسيع إنشاء مقاطع فيديو متعددة الأشخاص يتحدثون مع تحسين التفاعل
REASONEDIT: نحو نماذج تحرير الصور المعززة بالاستدلال
OpenApps: محاكاة التغيرات البيئية لقياس موثوقية واجهة المستخدم-الوكيل
تقرير تقني عن Qwen3-VL
G2VLM: نموذج رؤية ولغة مُوجَّهٌ بالهندسة مع إعادة بناء ثلاثية الأبعاد الموحَّدة والاستدلال المكاني
متعدد المعايير: تقييم المحكمين متعددي الوسائط وفقًا لمعايير متعددة
ميرا: وكيل الاستدلال التكراري متعدد الوسائط للتعديل الصوتي
ENACT: تقييم الذكاء المُشَكَّل باستخدام نمذجة العالم للتفاعل من منظور الشخص الأول
الرسمة إلى الصورة: توليد صور مركبة باستخدام تحكم متعدد الوسائط
نماذج توليد الفيديو جيدة كنماذج مكافأة ذاتية مخفية
ديب سيك ماث فاير: نحو الاستنتاج الرياضي ذاتي التحقق
ToolOrchestra: رفع مستوى الذكاء من خلال تنسيق فعّال للنماذج والأدوات
فكّر بصريًا، وتفنّن نصيًا: التآزر بين الرؤية واللغة في ARC
هارموني: مزج إنشاء الصوت والفيديو من خلال التآزر بين المهام المختلفة
إنفيريكس: محرك استنتاج من الجيل التالي مبني على التمايز الكتلي للنماذج العالمية للمحاكاة
التعاون الضمني في الأنظمة متعددة الوكلاء
التقييم متعدد الوسائط للهياكل اللغوية الروسية
جذر: مُحسِّن مُتَوَزَّنٌ مُتَمَيِّزٌ لتدريب الشبكات العصبية
يُنتج التراكب مقياسًا عصبيًا قويًا
أفضل حدود الأخطاء المثلى لتعلم آليات التحويل التتابعي