Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

تقرير فني عن Fun-ASR

تسريع البحث العلمي باستخدام جيمي: دراسات حالة وتقنيات شائعة































تقرير فني عن Fun-ASR

تسريع البحث العلمي باستخدام جيمي: دراسات حالة وتقنيات شائعة






























توسيع الوكالات الصغيرة من خلال المزادات الاستراتيجية
Vibe AIGC: منهج جديد لإنشاء المحتوى من خلال التنسيق الوكيل
PaperSearchQA: التعلُّم على البحث والاستنتاج عبر الأوراق العلمية باستخدام RLVR
إيغو أكتور: ترسيخ تخطيط المهام في الإجراءات المكانية الواعية ذات النظرة الذاتية للروبوتات البشرية من خلال نماذج الرؤية واللغة
A-RAG: التوسيع التلقائي للحصول على التوليد المدعوم بالاسترجاع عبر واجهات استرجاع هرمية
Quant VideoGen: توليد فيديو طويل متسلسل عبر التكميم ثنائي البت لذاكرة التخزين المؤقت KV
SoMA: مُحاكِي عَصْبيٌّ من الواقع إلى المحاكاة لتشغيل الأجسام الرخوة الروبوتية
التحكم الضمني في الحركة المستشعرة ثلاثية الأبعاد للإGenerating فيديو بشري متكيف مع الزاوية البصرية
داوينسي-إيسيجني: فتح بيانات الوكالة على المدى الطويل بكفاءة عالية في البيانات
البحث حول النماذج العالمية ليس مجرد إدخال معرفة العالم إلى مهام محددة
AOrchestra: أوتوماتيكيّة إنشاء الوكلاء الفرعيين لتنظيم الوكلاء الوظيفيّة
لا يوجد خطة عالمية في سلسلة التفكير: كشف الحد الزمني الخفي للخطط في نماذج LLM
CodeOCR: حول فعالية نماذج الرؤية واللغة في فهم التعليمات البرمجية
DeepPlanning: تقييم التخطيط الواعي على المدى الطويل مع قيود قابلة للتحقق
CL-bench: معيار لتعلم السياق
التعلم المعزز من خلال التباعد الذاتي
الروبوتات الحوارية كأصدقاء اجتماعيين: كيف يُدرك الناس الوعي والتشابه البشري والفوائد الصحية الاجتماعية في الآلات
البوب: تعلّم التفكير في المشكلات الصعبة من خلال الاستكشاف المُفضّل على السياسة
UniReason 1.0: إطار تفكير موحد لتخليق وتحرير الصور المتوافق مع المعرفة العالمية
إغلاق الدورة: تمثيل المستودع الشامل باستخدام RPG-Encoder
مختبر فيزيون-ديب ريسيرش: إعادة التفكير في البحث البصري والنصي للنماذج اللغوية الكبيرة متعددة الوسائط
Vision-DeepResearch: تحفيز القدرة على البحث العميق في النماذج اللغوية الكبيرة متعددة الوسائط
كيمي كي2.5: ذكاء عقلي بصري
Green-VLA: نموذج مرحلية للرؤية واللغة والعمل لروبوتات عامة
PaperBanana: أتمتة التصوير الأكاديمي للعلماء الذكاء الاصطناعي
اكتشاف رياضيات شبه تلقائي باستخدام جيميني: دراسة حالة حول مسائل إردوش
السلاسل الكامنة كتخطيط: فصل التفكير عن التعبير اللغوي
نموذج مكافأة مُتماشٍ في الوقت الفعلي يتجاوز المعنى
DenseGRPO: من المكافأة النادرة إلى المكافأة الكثيفة لمحاذاة نموذج مطابقة التدفق
DreamActor-M2: توليد حركة صورة الشخصية الشاملة عبر التعلم الفضائي-الزمني داخل السياق
توسيع الوكالات الصغيرة من خلال المزادات الاستراتيجية
Vibe AIGC: منهج جديد لإنشاء المحتوى من خلال التنسيق الوكيل
PaperSearchQA: التعلُّم على البحث والاستنتاج عبر الأوراق العلمية باستخدام RLVR
إيغو أكتور: ترسيخ تخطيط المهام في الإجراءات المكانية الواعية ذات النظرة الذاتية للروبوتات البشرية من خلال نماذج الرؤية واللغة
A-RAG: التوسيع التلقائي للحصول على التوليد المدعوم بالاسترجاع عبر واجهات استرجاع هرمية
Quant VideoGen: توليد فيديو طويل متسلسل عبر التكميم ثنائي البت لذاكرة التخزين المؤقت KV
SoMA: مُحاكِي عَصْبيٌّ من الواقع إلى المحاكاة لتشغيل الأجسام الرخوة الروبوتية
التحكم الضمني في الحركة المستشعرة ثلاثية الأبعاد للإGenerating فيديو بشري متكيف مع الزاوية البصرية
داوينسي-إيسيجني: فتح بيانات الوكالة على المدى الطويل بكفاءة عالية في البيانات
البحث حول النماذج العالمية ليس مجرد إدخال معرفة العالم إلى مهام محددة
AOrchestra: أوتوماتيكيّة إنشاء الوكلاء الفرعيين لتنظيم الوكلاء الوظيفيّة
لا يوجد خطة عالمية في سلسلة التفكير: كشف الحد الزمني الخفي للخطط في نماذج LLM
CodeOCR: حول فعالية نماذج الرؤية واللغة في فهم التعليمات البرمجية
DeepPlanning: تقييم التخطيط الواعي على المدى الطويل مع قيود قابلة للتحقق
CL-bench: معيار لتعلم السياق
التعلم المعزز من خلال التباعد الذاتي
الروبوتات الحوارية كأصدقاء اجتماعيين: كيف يُدرك الناس الوعي والتشابه البشري والفوائد الصحية الاجتماعية في الآلات
البوب: تعلّم التفكير في المشكلات الصعبة من خلال الاستكشاف المُفضّل على السياسة
UniReason 1.0: إطار تفكير موحد لتخليق وتحرير الصور المتوافق مع المعرفة العالمية
إغلاق الدورة: تمثيل المستودع الشامل باستخدام RPG-Encoder
مختبر فيزيون-ديب ريسيرش: إعادة التفكير في البحث البصري والنصي للنماذج اللغوية الكبيرة متعددة الوسائط
Vision-DeepResearch: تحفيز القدرة على البحث العميق في النماذج اللغوية الكبيرة متعددة الوسائط
كيمي كي2.5: ذكاء عقلي بصري
Green-VLA: نموذج مرحلية للرؤية واللغة والعمل لروبوتات عامة
PaperBanana: أتمتة التصوير الأكاديمي للعلماء الذكاء الاصطناعي
اكتشاف رياضيات شبه تلقائي باستخدام جيميني: دراسة حالة حول مسائل إردوش
السلاسل الكامنة كتخطيط: فصل التفكير عن التعبير اللغوي
نموذج مكافأة مُتماشٍ في الوقت الفعلي يتجاوز المعنى
DenseGRPO: من المكافأة النادرة إلى المكافأة الكثيفة لمحاذاة نموذج مطابقة التدفق
DreamActor-M2: توليد حركة صورة الشخصية الشاملة عبر التعلم الفضائي-الزمني داخل السياق