Command Palette
Search for a command to run...
استراتيجية متوسط السرعة (MVP)
تم اقتراح سياسة متوسط السرعة (MVP) بشكل مشترك من قبل فرق بحثية من جامعة تسينغهوا (كلية المركبات والنقل وكلية الذكاء الاصطناعي)، ومختبر أبحاث الذكاء الاصطناعي بجامعة كاليفورنيا في بيركلي (BAIR)، وجامعة هونغ كونغ. وقد نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "سياسة التدفق المتوسط مع قيد السرعة اللحظية لتوليد الإجراءات بخطوة واحدةوقد تم قبولها من قبل المؤتمر الدولي لأبحاث العلاقات العمالية (ICLR) لعام 2026.
MVP هي سياسة توليدية مبتكرة للتعلم المعزز، تُحقق أسرع توليد للحركة بخطوة واحدة من خلال نمذجة "حقل السرعة المتوسطة"، مما يُلغي تمامًا العبء الحسابي لأخذ العينات متعددة الخطوات. ولمعالجة تحدي غياب الشروط الحدية الصريحة في النموذج، قدّم فريق البحث "قيود السرعة اللحظية (IVC)"، مما حسّن بشكل فعّال دقة التعلم وقدرة السياسة على التعبير. عمليًا، تُحسّن MVP بشكل ملحوظ سرعة التدريب والاستدلال (يبلغ متوسط زمن الاستدلال بخطوة واحدة 10.93 مللي ثانية فقط)، وتحقق معدل نجاح متوسطًا متميزًا يبلغ 0.88 في مهام معالجة الروبوت المعقدة في Robomimic وOGBench، لتصل بذلك إلى أعلى مستويات الأداء في هذا المجال.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.