التاريخ

منذ 7 أشهر

المؤسسة

رابط الورقة البحثية

2507.22034

الوسوم

تم اقتراح UserBench بشكل مشترك من قبل فريق Salesforce AI Research وجامعة إلينوي في أوربانا شامبين في يوليو 2025، وتم نشر نتائج البحث ذات الصلة في الورقة "UserBench: بيئة صالة ألعاب رياضية تفاعلية للوكلاء الموجهين نحو المستخدم".

UserBench هو معيار مُركّز على المستخدم، مُصمّم لتقييم أداء الوكلاء في تفاعلات متعددة الأدوار قائمة على التفضيلات. في UserBench، يُقدّم المستخدمون المُحاكيون تعليمات أولية غامضة للمهام، تكشف تدريجيًا عن التفضيلات بمرور الوقت، وغالبًا ما تكون ضمنية. يجب على الوكلاء توضيح أهدافهم بشكل استباقي، وتفسير الإشارات الدقيقة، والنجاح من خلال أدوات التفكير التكيفي. بُني UserBench على إطار عمل Gymnasium القياسي، وهو يُقدّم إعدادًا معياريًا وقابلًا للتطوير مع واجهات تفاعلية موحدة وواجهة خلفية مستقرة لاستخدام الأدوات، مما يُتيح تقييمًا دقيقًا وقابلًا للتكرار.

نموذج حساء

يمكن لتقنية "Model Souping" توليد نموذج أفضل عن طريق حساب متوسط أوزان عمليات الضبط الدقيق المتعددة.

منذ 3 أشهر

وورلد جين

يتمتع برنامج WorldGen بالقدرة على إنشاء عوالم عرض في الوقت الفعلي موحدة هندسيًا وغنية بصريًا وعالية الكفاءة.

منذ 3 أشهر

تعزيز الفكر الموجه

يمكن لتقنية GTR أن توجه عملية التفكير النموذجي في البيئات البصرية المعقدة وتمنع "انهيار الدماغ".

منذ 2 أشهر

التعلم أثناء النشر

LWD هو إطار عمل للتعلم المعزز على مستوى الأسطول من وضع عدم الاتصال إلى وضع الاتصال، والذي يمكّن الروبوتات ذات الأغراض العامة من جمع الخبرة باستمرار وتحقيق التطور الذاتي للسياسات.

منذ شهر واحد

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

يحل هذا النظام بفعالية التحديات الرئيسية في عملية المحاذاة الآمنة لـ LVLM.

منذ 3 أشهر

تمريرة أمامية مُفككة (DePass)

تُستخدم DePass لتفسير نموذج Transformer عن طريق تحليل المرور الأمامي.

منذ 3 أشهر

رسم شجرة فك تشفير رمز الرسالة المتفرقة

من خلال الاستفادة من التوازي في وحدة معالجة الرسومات لتوسيع شجرة فك التشفير بكفاءة، يتم تحقيق تحسين سريع وقابل للتوسع لمسار الاستدلال.

منذ 3 أشهر

حساء الخبراء في فئة SoCE

SoCE هو نموذج لتحسين النماذج يعتمد على آلية اختيار الخبراء التلقائية الواعية بالفئات ويتم دمجه مع مهام قياس الأداء المتعددة.

منذ 3 أشهر

طريقة التعرف على بصمات الأصابع iSeal

يحقق iSeal معدل نجاح بصمة 100% (FSR) ضد أكثر من 10 هجمات على 12 LLMs.

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

Command Palette

معيار UserBench

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

معيار UserBench

ذات صلة ويكي

نموذج حساء

وورلد جين

تعزيز الفكر الموجه

التعلم أثناء النشر

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

تمريرة أمامية مُفككة (DePass)

رسم شجرة فك تشفير رمز الرسالة المتفرقة

حساء الخبراء في فئة SoCE

طريقة التعرف على بصمات الأصابع iSeal

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

معيار UserBench

ذات صلة ويكي

نموذج حساء

وورلد جين

تعزيز الفكر الموجه

التعلم أثناء النشر

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

تمريرة أمامية مُفككة (DePass)

رسم شجرة فك تشفير رمز الرسالة المتفرقة

حساء الخبراء في فئة SoCE

طريقة التعرف على بصمات الأصابع iSeal

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة ويكي

نموذج حساء

وورلد جين

تعزيز الفكر الموجه

التعلم أثناء النشر

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

تمريرة أمامية مُفككة (DePass)

رسم شجرة فك تشفير رمز الرسالة المتفرقة

حساء الخبراء في فئة SoCE

طريقة التعرف على بصمات الأصابع iSeal

ذات صلة ويكي

نموذج حساء

وورلد جين

تعزيز الفكر الموجه

التعلم أثناء النشر

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

تمريرة أمامية مُفككة (DePass)

رسم شجرة فك تشفير رمز الرسالة المتفرقة

حساء الخبراء في فئة SoCE

طريقة التعرف على بصمات الأصابع iSeal