Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

الانتباه الكتلي النادر عبر تبديل الرموز

تعريف بالذكاء الاصطناعي العام





























الانتباه الكتلي النادر عبر تبديل الرموز

تعريف بالذكاء الاصطناعي العام




























من التصفية إلى التحسين: إطار تصحيح لنموذج التشتت البصري-اللغوي
مثال خطوة بخطوة، تحسين حسب القطعة: GRPO على مستوى القطعة للتحويل النصي إلى صورة
فيديو-كـمُبَرَّر: التحكم الموحّد في المعنى لتجهيز الفيديو
DeepAgent: وكيل استنتاج عام يمتلك مجموعات أدوات قابلة للتوسع
نماذج انتشار موجهة بالتعلم التكراري متعدد الأهداف المُدرَّبة على التعرف على عدم اليقين لتصميم جزيئي ثلاثي الأبعاد من الصفر
رياك-ديسكفري: منصة تُقودها الذكاء الاصطناعي لاستكشاف وتحسين المفاعلات الحفازة ذات التدفق المستمر
BoltzGen: نحو تصميم مُربط شامل
HSCodeComp: معيار واقعي ومتخصص لوكالات البحث العميقة في تطبيق القواعد الهرمية
DyPE: الاستقراء الديناميكي للموقع للانفجار عالي الدقة للغاية
هولوسيني: توليد شمولي لسرد قصصي فيديو طويل متعدد اللقطات سينمائي
فيديو Open-o3: الاستدلال على الفيديو القائم على أساس الأدلة المكانية الزمنية الصريحة
AdaSPEC: تقليل المعرفة المُوجَّه لمشغلات التخمين الفعّالة
التعاون بين الإنسان والوكيل في صناعة المقالات إلى صفحات بسعر أقل من 0.1 دولار
انظر النص: من التجزئة إلى القراءة البصرية
إدخال الاستدلال الاتجاهي لتحسين الملاءمة النهائية لـ MLLMs
النماذج اللغوية هي تطبيقات مميزة وبالتالي قابلة للعكس
المحول الحر
تنبؤ بوقت معالجة وحدة المعالجة الكمية (QPU) باستخدام التعلم الآلي
ملاحظة التداخل البناء عند حافة التماثل الكمي
VideoAgentTrek: التدريب المسبق على استخدام الحاسوب من مقاطع فيديو غير مُعلَّمة
جيجابراين-0: نموذج رؤية-لغة-عمل مدعوم بنموذج عالمي
LoongRL: التعلم المعزز للتفكير المتقدم على السياقات الطويلة
BAPO: تثبيت التعلم التعزيزي خارج النمط لنموذجات اللغة الكبيرة من خلال تحسين السياسة المتوازنة مع قص تكيفي
كل انتباه يهم: معمارية هجينة فعّالة للاستدلال بسياق طويل
اللون بالطريقة الصحيحة: تجسّد الفضاءات اللونية الإدراكية وتمثيلات النصوص لتحسين توليد التفتيت
الاستدلال المكاني باستخدام نماذج الرؤية واللغة في المشاهد متعددة الزوايا من منظور الذات
LoFT: التخصيص الفعّال من حيث المعلّمات للتعلم شبه المراقب للسياقات الطويلة التوزيع في سيناريوهات العالم المفتوح
زهري: تعميم سياسات الروبوت الشاملة بفضل سياسات التدفق الفعالة للرؤية واللغة والعمل
تحسين السياسة الموجه بالاستبدال للنماذج الكبيرة لغة الت(diffusion)
MCP-AgentBench: تقييم أداء الوكيل اللغوي في العالم الحقيقي باستخدام أدوات متوسطة بواسطة MCP
من التصفية إلى التحسين: إطار تصحيح لنموذج التشتت البصري-اللغوي
مثال خطوة بخطوة، تحسين حسب القطعة: GRPO على مستوى القطعة للتحويل النصي إلى صورة
فيديو-كـمُبَرَّر: التحكم الموحّد في المعنى لتجهيز الفيديو
DeepAgent: وكيل استنتاج عام يمتلك مجموعات أدوات قابلة للتوسع
نماذج انتشار موجهة بالتعلم التكراري متعدد الأهداف المُدرَّبة على التعرف على عدم اليقين لتصميم جزيئي ثلاثي الأبعاد من الصفر
رياك-ديسكفري: منصة تُقودها الذكاء الاصطناعي لاستكشاف وتحسين المفاعلات الحفازة ذات التدفق المستمر
BoltzGen: نحو تصميم مُربط شامل
HSCodeComp: معيار واقعي ومتخصص لوكالات البحث العميقة في تطبيق القواعد الهرمية
DyPE: الاستقراء الديناميكي للموقع للانفجار عالي الدقة للغاية
هولوسيني: توليد شمولي لسرد قصصي فيديو طويل متعدد اللقطات سينمائي
فيديو Open-o3: الاستدلال على الفيديو القائم على أساس الأدلة المكانية الزمنية الصريحة
AdaSPEC: تقليل المعرفة المُوجَّه لمشغلات التخمين الفعّالة
التعاون بين الإنسان والوكيل في صناعة المقالات إلى صفحات بسعر أقل من 0.1 دولار
انظر النص: من التجزئة إلى القراءة البصرية
إدخال الاستدلال الاتجاهي لتحسين الملاءمة النهائية لـ MLLMs
النماذج اللغوية هي تطبيقات مميزة وبالتالي قابلة للعكس
المحول الحر
تنبؤ بوقت معالجة وحدة المعالجة الكمية (QPU) باستخدام التعلم الآلي
ملاحظة التداخل البناء عند حافة التماثل الكمي
VideoAgentTrek: التدريب المسبق على استخدام الحاسوب من مقاطع فيديو غير مُعلَّمة
جيجابراين-0: نموذج رؤية-لغة-عمل مدعوم بنموذج عالمي
LoongRL: التعلم المعزز للتفكير المتقدم على السياقات الطويلة
BAPO: تثبيت التعلم التعزيزي خارج النمط لنموذجات اللغة الكبيرة من خلال تحسين السياسة المتوازنة مع قص تكيفي
كل انتباه يهم: معمارية هجينة فعّالة للاستدلال بسياق طويل
اللون بالطريقة الصحيحة: تجسّد الفضاءات اللونية الإدراكية وتمثيلات النصوص لتحسين توليد التفتيت
الاستدلال المكاني باستخدام نماذج الرؤية واللغة في المشاهد متعددة الزوايا من منظور الذات
LoFT: التخصيص الفعّال من حيث المعلّمات للتعلم شبه المراقب للسياقات الطويلة التوزيع في سيناريوهات العالم المفتوح
زهري: تعميم سياسات الروبوت الشاملة بفضل سياسات التدفق الفعالة للرؤية واللغة والعمل
تحسين السياسة الموجه بالاستبدال للنماذج الكبيرة لغة الت(diffusion)
MCP-AgentBench: تقييم أداء الوكيل اللغوي في العالم الحقيقي باستخدام أدوات متوسطة بواسطة MCP