التاريخ

منذ 3 أشهر

المؤسسة

رابط الورقة البحثية

openreview.net

الوسوم

التعلم القوي

تم اقتراح سياسة متوسط السرعة (MVP) بشكل مشترك من قبل فرق بحثية من جامعة تسينغهوا (كلية المركبات والنقل وكلية الذكاء الاصطناعي)، ومختبر أبحاث الذكاء الاصطناعي بجامعة كاليفورنيا في بيركلي (BAIR)، وجامعة هونغ كونغ. وقد نُشرت نتائج البحث ذات الصلة في ورقة بحثية بعنوان "سياسة التدفق المتوسط مع قيد السرعة اللحظية لتوليد الإجراءات بخطوة واحدةوقد تم قبولها من قبل المؤتمر الدولي لأبحاث العلاقات العمالية (ICLR) لعام 2026.

MVP هي سياسة توليدية مبتكرة للتعلم المعزز، تُحقق أسرع توليد للحركة بخطوة واحدة من خلال نمذجة "حقل السرعة المتوسطة"، مما يُلغي تمامًا العبء الحسابي لأخذ العينات متعددة الخطوات. ولمعالجة تحدي غياب الشروط الحدية الصريحة في النموذج، قدّم فريق البحث "قيود السرعة اللحظية (IVC)"، مما حسّن بشكل فعّال دقة التعلم وقدرة السياسة على التعبير. عمليًا، تُحسّن MVP بشكل ملحوظ سرعة التدريب والاستدلال (يبلغ متوسط زمن الاستدلال بخطوة واحدة 10.93 مللي ثانية فقط)، وتحقق معدل نجاح متوسطًا متميزًا يبلغ 0.88 في مهام معالجة الروبوت المعقدة في Robomimic وOGBench، لتصل بذلك إلى أعلى مستويات الأداء في هذا المجال.

نموذج العمل العالمي (وام)

WAM عبارة عن بنية نموذجية أساسية جديدة للذكاء الاصطناعي في مجالات الذكاء المجسد والروبوتات.

منذ 2 أشهر

التقطيع الجشع لعائد الذروة

تعمل PRGS بشكل كبير على تحسين قدرة نماذج التعلم المعزز غير المتصلة بالإنترنت على ربط التجارب ذات المكافآت العالية.

منذ 3 أشهر

نظرية الفضاء

تشير النظرية المكانية إلى إطار عمل قدرة العامل الذكي على بناء وتحديث واستخدام المعتقدات المكانية في بيئة ذات معلومات غير كاملة من خلال الاستكشاف النشط.

منذ 3 أشهر

كلب الصيد الكثيف

يُعد محرك البحث الكثيف مسؤولاً عن إيجاد الفقرات الأكثر صلة بدلالات الاستعلام بسرعة من مكتبة وثائق ضخمة، وهو المكون الأساسي لنظام توليد تحسين البحث.

منذ 3 أشهر

التعلم أثناء النشر

LWD هو إطار عمل للتعلم المعزز على مستوى الأسطول من وضع عدم الاتصال إلى وضع الاتصال، والذي يمكّن الروبوتات ذات الأغراض العامة من جمع الخبرة باستمرار وتحقيق التطور الذاتي للسياسات.

منذ 2 أشهر

تعزيز الفكر الموجه

يمكن لتقنية GTR أن توجه عملية التفكير النموذجي في البيئات البصرية المعقدة وتمنع "انهيار الدماغ".

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

HyperAI

التاريخ

منذ 3 أشهر

المؤسسة

رابط الورقة البحثية

openreview.net

الوسوم

التعلم القوي

نموذج العمل العالمي (وام)

WAM عبارة عن بنية نموذجية أساسية جديدة للذكاء الاصطناعي في مجالات الذكاء المجسد والروبوتات.

منذ 2 أشهر

تعزيز الفكر الموجه

يمكن لتقنية GTR أن توجه عملية التفكير النموذجي في البيئات البصرية المعقدة وتمنع "انهيار الدماغ".

منذ 3 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة ويكي

نموذج العمل العالمي (وام)

التقطيع الجشع لعائد الذروة

نظرية الفضاء

كلب الصيد الكثيف

التعلم أثناء النشر

تعزيز الفكر الموجه

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة ويكي

نموذج العمل العالمي (وام)

التقطيع الجشع لعائد الذروة

نظرية الفضاء

كلب الصيد الكثيف

التعلم أثناء النشر

تعزيز الفكر الموجه

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة ويكي

نموذج العمل العالمي (وام)

التقطيع الجشع لعائد الذروة

نظرية الفضاء

كلب الصيد الكثيف

التعلم أثناء النشر

تعزيز الفكر الموجه

ذات صلة ويكي

نموذج العمل العالمي (وام)

التقطيع الجشع لعائد الذروة

نظرية الفضاء

كلب الصيد الكثيف

التعلم أثناء النشر

تعزيز الفكر الموجه

Command Palette

استراتيجية متوسط السرعة (MVP)

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

استراتيجية متوسط السرعة (MVP)

ذات صلة ويكي

نموذج العمل العالمي (وام)

التقطيع الجشع لعائد الذروة

نظرية الفضاء

كلب الصيد الكثيف

التعلم أثناء النشر

تعزيز الفكر الموجه

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

استراتيجية متوسط السرعة (MVP)

ذات صلة ويكي

نموذج العمل العالمي (وام)

التقطيع الجشع لعائد الذروة

نظرية الفضاء

كلب الصيد الكثيف

التعلم أثناء النشر

تعزيز الفكر الموجه

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

ذات صلة ويكي

نموذج العمل العالمي (وام)

التقطيع الجشع لعائد الذروة

نظرية الفضاء

كلب الصيد الكثيف

التعلم أثناء النشر

تعزيز الفكر الموجه

ذات صلة ويكي

نموذج العمل العالمي (وام)

التقطيع الجشع لعائد الذروة

نظرية الفضاء

كلب الصيد الكثيف

التعلم أثناء النشر

تعزيز الفكر الموجه