Command Palette
Search for a command to run...
الأوراق البحثية
أوراق بحثية متطورة في مجال الذكاء الاصطناعي يتم تحديثها يوميًا لمساعدتك على مواكبة أحدث اتجاهات الذكاء الاصطناعي

المُراجع: ما وراء الانعكاس النصي، نحو الاستدلال الانعكاسي متعدد الوسائط في فهم الفيديو الطويل

MVI-Bench: معيار شامل لتقييم المقاومة للمدخلات البصرية المضللة في نماذج LVLM































المُراجع: ما وراء الانعكاس النصي، نحو الاستدلال الانعكاسي متعدد الوسائط في فهم الفيديو الطويل

MVI-Bench: معيار شامل لتقييم المقاومة للمدخلات البصرية المضللة في نماذج LVLM






























هل يمكن للمحاكيات العالمية التفكير؟ Gen-ViRe: معيار تفكير بصري توليدي
نمط واحد يساوي رمزًا واحدًا: فتح إمكانية توليد الصور من النمط عبر الفضاء النمطي المنفصل
AraLingBench: معيار مُعلَّم بالبشر لتقييم القدرات اللغوية للغة العربية في نماذج اللغة الكبيرة
فكّر-بشكلٍ صعب: تكرارات مُحَدَّدة في المساحة الخفية لتحسين نماذج اللغة الاستنتاجية
HumanSense: من الإدراك متعدد الوسائط إلى الاستجابة المتعاطفة المدروسة في سياقها من خلال التفكير في نماذج التعلم الآلي الكبيرة المُتعددة الوسائط
CamCloneMaster: تمكين التحكم في الكاميرا القائمة على المرجع لتحرير الفيديو
EditScore: فتح التعلم المعزز عبر الإنترنت للتحرير الصوري من خلال نمذجة المكافأة عالية الولادة
InteractMove: توليد التفاعل البشري-الكائن المُتحكم به نصيًا في المشاهد ثلاثية الأبعاد مع كائنات قابلة للتحريك
WebCoach: وكيل ويب ذاتي التطور مع توجيه الذاكرة عبر الجلسات
التعلم للثقة: التكيف بايزي مع موثوقية المُقترح المتفاوتة في اتخاذ القرارات التسلسلية
GroupRank: منهج إعادة ترتيب جماعي يُقود بواسطة التعلم المعزز
MMaDA-Parallel: نماذج لغوية تشتتية كبيرة متعددة الوسائط للتحرير والتكوين الواعي بالتفكير
TiViBench: تقييم التفكير في الفيديو للنماذج التوليدية للفيديوهات
Part-X-MLLM: نموذج لغة كبير متعدد الوسائط ثلاثي الأبعاد يُدرك الأجزاء
Uni-MoE-2.0-Omni: توسيع النموذج الكبير المتعدد الوسائط المتمحور حول اللغة باستخدام MoE المتقدمة، والتدريب، والبيانات
P1: إتقان مسابقات الفيزياء باستخدام التعلم المعزز
لانسلوت: نحو تعلم تجميعي مقاوم للبوزيان وفعال وحافظ على الخصوصية ضمن التشفير الكامل المتجانس
نموذج الت(diffusion) الخفي دون مُشفِّر تلقائي تبايني
RewardMap: معالجة المكافآت النادرة في الاستدلال البصري الدقيق من خلال التعلم المعزز متعدد المراحل
ReinFlow: التخصيص التدريجي لسياسة مطابقة التدفق باستخدام التعلم التعلّمي عبر الإنترنت
تقييم الصوت لقدرة التفكير: تشخيص الفجوة في الأداء الناتجة عن الوسيلة
MarsRL: تطوير نظام التفكير متعدد الوكلاء من خلال التعلم التعزيزي مع التوازي الأنبوبية الوكيلة
الشبكات ذات العرض الافتراضي
AIonopedia: وكيل LLM يُنسق التعلُّم متعدد الوسائط لاكتشاف السوائل الأيونية
UI2CodeextN: نموذج لغوي بصري لإنشاء التعليمات البرمجية التفاعلية من واجهة المستخدم قابلة للتوسع عند وقت الاختبار
GGBench: معيار استنتاج توليدي هندسي للنماذج متعددة الوسائط الموحّدة
WEAVE: إطلاق القدرة على الفهم والتوظيف المتقاطع في السياق وbenchmarking
DoPE: تضمين الموضع الدوراني لتنقية الضوضاء
نموذج تعلم تجميعي مقاوم للاضطرابات بيسانتيني مبني على البلوك تشين BRFL
نمذجة التوزيع متعدد الحدودية لوقت مشاهدة الفيديو عبر شبكة مزيج أسي-غاوسي
هل يمكن للمحاكيات العالمية التفكير؟ Gen-ViRe: معيار تفكير بصري توليدي
نمط واحد يساوي رمزًا واحدًا: فتح إمكانية توليد الصور من النمط عبر الفضاء النمطي المنفصل
AraLingBench: معيار مُعلَّم بالبشر لتقييم القدرات اللغوية للغة العربية في نماذج اللغة الكبيرة
فكّر-بشكلٍ صعب: تكرارات مُحَدَّدة في المساحة الخفية لتحسين نماذج اللغة الاستنتاجية
HumanSense: من الإدراك متعدد الوسائط إلى الاستجابة المتعاطفة المدروسة في سياقها من خلال التفكير في نماذج التعلم الآلي الكبيرة المُتعددة الوسائط
CamCloneMaster: تمكين التحكم في الكاميرا القائمة على المرجع لتحرير الفيديو
EditScore: فتح التعلم المعزز عبر الإنترنت للتحرير الصوري من خلال نمذجة المكافأة عالية الولادة
InteractMove: توليد التفاعل البشري-الكائن المُتحكم به نصيًا في المشاهد ثلاثية الأبعاد مع كائنات قابلة للتحريك
WebCoach: وكيل ويب ذاتي التطور مع توجيه الذاكرة عبر الجلسات
التعلم للثقة: التكيف بايزي مع موثوقية المُقترح المتفاوتة في اتخاذ القرارات التسلسلية
GroupRank: منهج إعادة ترتيب جماعي يُقود بواسطة التعلم المعزز
MMaDA-Parallel: نماذج لغوية تشتتية كبيرة متعددة الوسائط للتحرير والتكوين الواعي بالتفكير
TiViBench: تقييم التفكير في الفيديو للنماذج التوليدية للفيديوهات
Part-X-MLLM: نموذج لغة كبير متعدد الوسائط ثلاثي الأبعاد يُدرك الأجزاء
Uni-MoE-2.0-Omni: توسيع النموذج الكبير المتعدد الوسائط المتمحور حول اللغة باستخدام MoE المتقدمة، والتدريب، والبيانات
P1: إتقان مسابقات الفيزياء باستخدام التعلم المعزز
لانسلوت: نحو تعلم تجميعي مقاوم للبوزيان وفعال وحافظ على الخصوصية ضمن التشفير الكامل المتجانس
نموذج الت(diffusion) الخفي دون مُشفِّر تلقائي تبايني
RewardMap: معالجة المكافآت النادرة في الاستدلال البصري الدقيق من خلال التعلم المعزز متعدد المراحل
ReinFlow: التخصيص التدريجي لسياسة مطابقة التدفق باستخدام التعلم التعلّمي عبر الإنترنت
تقييم الصوت لقدرة التفكير: تشخيص الفجوة في الأداء الناتجة عن الوسيلة
MarsRL: تطوير نظام التفكير متعدد الوكلاء من خلال التعلم التعزيزي مع التوازي الأنبوبية الوكيلة
الشبكات ذات العرض الافتراضي
AIonopedia: وكيل LLM يُنسق التعلُّم متعدد الوسائط لاكتشاف السوائل الأيونية
UI2CodeextN: نموذج لغوي بصري لإنشاء التعليمات البرمجية التفاعلية من واجهة المستخدم قابلة للتوسع عند وقت الاختبار
GGBench: معيار استنتاج توليدي هندسي للنماذج متعددة الوسائط الموحّدة
WEAVE: إطلاق القدرة على الفهم والتوظيف المتقاطع في السياق وbenchmarking
DoPE: تضمين الموضع الدوراني لتنقية الضوضاء
نموذج تعلم تجميعي مقاوم للاضطرابات بيسانتيني مبني على البلوك تشين BRFL
نمذجة التوزيع متعدد الحدودية لوقت مشاهدة الفيديو عبر شبكة مزيج أسي-غاوسي