Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

الإستدعاء المشترك للسياسات

التوليد البصري في العصر الجديد: تطور من الخرائط الذرية إلى النمذجة العالمية الوكيلية































الإستدعاء المشترك للسياسات

التوليد البصري في العصر الجديد: تطور من الخرائط الذرية إلى النمذجة العالمية الوكيلية






























التعاون في نماذج علمية أساسية غير متجانسة
قوالب الانتشار: إطار عمل إضافي موحد للتحكم في عمليات الانتشار
RADIO-ViPE: التكامل الزمني المضغوط متعدد الوسائط للفهم الدلالي المفتوح في أنظمة SLAM في البيئات الديناميكية
ClawGym: إطار عمل قابل للتوسع لبناء وكلاء مخالب فعالين
تحقيق التحوّل: التنقيح عبر الهندسة المعمارية لنماذج اللغة الكبيرة المنتشرة
استكشاف النماذج اللغوية الكبيرة من خلال التكثيف الكامن
GLM-5V-Turbo: نحو نموذج أساسيات أصلي لوكلاء متعددو الوسائط
SWE-chat: تفاعلات وكلاء البرمجة مع المستخدمين الحقيقيين في البيئات الواقعية
AdaExplore: التكيف المدفوع بالفشل والبحث الحافظ على التنوع لتوليد الكفاءات بكفاءة
التحسين عبر التوليد: تعزيز مساحة التعديل يحسّن تحسين الصور في النماذج المتعددة الوسائط الموحدة
AutoResearchBench: اختبار وكلاء الذكاء الاصطناعي في اكتشاف الأدبيات العلمية المعقدة
ميتا-كو تي: تعزيز الدقة والتعميم في تحرير الصور
DV-World: تقييم وكلاء تصور البيانات في سيناريوهات العالم الحقيقي
البرمجة مع البيانات: هندسة البيانات الموجهة بالاختبارات لتحسين نماذج اللغة الكبيرة ذاتية التحسين من مجموعات البيانات الخام
الأنظمة المتعددة العوامل التكرارية
الاسترجاع المهاري المعزز للذكاء الاصطناعي الوكيل
SketchVLM: يمكن لنماذج اللغة والرؤية توضيح الأفكار عبر وصف الصور وتوجيه المستخدمين
RSRCC: معيار لفهم التغييرات الإقليمية في الاستشعار عن بُعد، مُصاغ من خلال ترتيب أفضل النماذج باستخدام الاسترجاع
LongSpeech: معيار قابل للتوسع للكتابة الصوتية، الترجمة، والفهم في الكلام الطويل
كلاومارك: معيار للعالم الحيّ للتفاعل متعدد الأدوار والأيام والمواد باستخدام وكلاء المساعدين
Tuna-2: دمج الصور البيكسلية يتفوق على محولات الرؤية في الفهم والتوليد متعدد الوسائط
سلامة الرؤيا واللغة والعمل: التهديدات، التحديات، التقييمات، والآليات
ReVSI: إعادة بناء تقييم الذكاء البصري المكاني للحصول على تقييم دقيق لاستنتاج VLM ثلاثي الأبعاد
من المهارات إلى المواهب: تنظيم وكلاء متنوعين كشرعية عالمية
World-R1: تعزيز القيود ثلاثية الأبعاد لتوليد الفيديو من النص
تحليل وتوليد الفيديو عبر دالة التقدم الدلالي (Semantic Progress Function)
SmartPhotoCrafter: توحيد عمليات الاستدلال والتوليد والتحسين لتحرير الصور الفوتوغرافية آلياً
السياقات ليست طويلة بما يكفي أبداً: الاستدلال المهيكل للإجابة على الأسئلة القابلة للتوسع عبر مجموعات المستندات الطويلة
AgentSearchBench: معيار لتقييم بحث الـ agent الذكي في البيئات الواقعية
FlowAnchor: تثبيت إشارة التحرير من أجل تحرير الفيديو بدون عملية عكسية (Inversion-Free)
التعاون في نماذج علمية أساسية غير متجانسة
قوالب الانتشار: إطار عمل إضافي موحد للتحكم في عمليات الانتشار
RADIO-ViPE: التكامل الزمني المضغوط متعدد الوسائط للفهم الدلالي المفتوح في أنظمة SLAM في البيئات الديناميكية
ClawGym: إطار عمل قابل للتوسع لبناء وكلاء مخالب فعالين
تحقيق التحوّل: التنقيح عبر الهندسة المعمارية لنماذج اللغة الكبيرة المنتشرة
استكشاف النماذج اللغوية الكبيرة من خلال التكثيف الكامن
GLM-5V-Turbo: نحو نموذج أساسيات أصلي لوكلاء متعددو الوسائط
SWE-chat: تفاعلات وكلاء البرمجة مع المستخدمين الحقيقيين في البيئات الواقعية
AdaExplore: التكيف المدفوع بالفشل والبحث الحافظ على التنوع لتوليد الكفاءات بكفاءة
التحسين عبر التوليد: تعزيز مساحة التعديل يحسّن تحسين الصور في النماذج المتعددة الوسائط الموحدة
AutoResearchBench: اختبار وكلاء الذكاء الاصطناعي في اكتشاف الأدبيات العلمية المعقدة
ميتا-كو تي: تعزيز الدقة والتعميم في تحرير الصور
DV-World: تقييم وكلاء تصور البيانات في سيناريوهات العالم الحقيقي
البرمجة مع البيانات: هندسة البيانات الموجهة بالاختبارات لتحسين نماذج اللغة الكبيرة ذاتية التحسين من مجموعات البيانات الخام
الأنظمة المتعددة العوامل التكرارية
الاسترجاع المهاري المعزز للذكاء الاصطناعي الوكيل
SketchVLM: يمكن لنماذج اللغة والرؤية توضيح الأفكار عبر وصف الصور وتوجيه المستخدمين
RSRCC: معيار لفهم التغييرات الإقليمية في الاستشعار عن بُعد، مُصاغ من خلال ترتيب أفضل النماذج باستخدام الاسترجاع
LongSpeech: معيار قابل للتوسع للكتابة الصوتية، الترجمة، والفهم في الكلام الطويل
كلاومارك: معيار للعالم الحيّ للتفاعل متعدد الأدوار والأيام والمواد باستخدام وكلاء المساعدين
Tuna-2: دمج الصور البيكسلية يتفوق على محولات الرؤية في الفهم والتوليد متعدد الوسائط
سلامة الرؤيا واللغة والعمل: التهديدات، التحديات، التقييمات، والآليات
ReVSI: إعادة بناء تقييم الذكاء البصري المكاني للحصول على تقييم دقيق لاستنتاج VLM ثلاثي الأبعاد
من المهارات إلى المواهب: تنظيم وكلاء متنوعين كشرعية عالمية
World-R1: تعزيز القيود ثلاثية الأبعاد لتوليد الفيديو من النص
تحليل وتوليد الفيديو عبر دالة التقدم الدلالي (Semantic Progress Function)
SmartPhotoCrafter: توحيد عمليات الاستدلال والتوليد والتحسين لتحرير الصور الفوتوغرافية آلياً
السياقات ليست طويلة بما يكفي أبداً: الاستدلال المهيكل للإجابة على الأسئلة القابلة للتوسع عبر مجموعات المستندات الطويلة
AgentSearchBench: معيار لتقييم بحث الـ agent الذكي في البيئات الواقعية
FlowAnchor: تثبيت إشارة التحرير من أجل تحرير الفيديو بدون عملية عكسية (Inversion-Free)