HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 13 أيام

DexFlyWheel: إطار لتعزيز البيانات قابِل للتوسعة وذاتي التحسّن لمهام التلاعب الدقيق

DexFlyWheel: إطار لتعزيز البيانات قابِل للتوسعة وذاتي التحسّن لمهام التلاعب الدقيق

الملخص

يُعد التلاعب الدقيق أمرًا بالغ الأهمية لتعزيز قدرات الروبوتات في التطبيقات الواقعية، غير أن المجموعات البيانات المتنوعة والعالية الجودة ما زالت نادرة. تعتمد الطرق الحالية لجمع البيانات إما على التحكم عن بُعد من قبل البشر، أو تتطلب هندسة بشرية كبيرة، أو تُنتج بيانات ذات تنوع محدود، مما يحد من قابليتها للتوسع وعموميتها. في هذا البحث، نقدّم "DexFlyWheel"، وهي إطار لتحسين إنشاء البيانات قابل للتوسع، يعتمد على دورة ذاتية التحسين لتعزيز التنوّع في البيانات بشكل مستمر. تبدأ العملية بتحفيز أولي فعّال باستخدام عينات توضيحية مبدئية، ثم يتم توسيع مجموعة البيانات من خلال دورات متكررة. تتبع كل دورة نموذجًا مغلقًا يدمج التعلم بالمحاكاة (IL)، والتعلم التعزيزي المتبقي (residual RL)، وجمع مسارات التدفق (rollout trajectories)، وتعزيز البيانات. وبشكل خاص، يستخرج التعلم بالمحاكاة سلوكًا يشبه السلوك البشري من العينات التوضيحية، بينما يعزز التعلم التعزيزي المتبقي عامّية السياسة. ثم تُستخدم السياسة المُكتسبة لإنجاز مسارات في البيئة الافتراضية، والتي تُخضع لعمليات تعزيز عبر بيئات متنوعة وتكوينات مكانيّة مختلفة قبل أن تُعاد إلى الدورة التالية. مع التكرار المستمر، يظهر تأثير "عجلة الطيران الذاتية التحسين" (self-improving data flywheel)، ما يؤدي إلى إنتاج مجموعات بيانات تغطي سيناريوهات متنوعة، وبالتالي تُحسّن أداء السياسة. أظهرت النتائج التجريبية أن "DexFlyWheel" تمكّن من إنشاء أكثر من 2000 توضيح متنوع عبر أربع مهام صعبة. وحققت السياسات المدربة على مجموعتنا معدل نجاح متوسط بلغ 81.9% على مجموعات اختبار التحدي، وتمكّنت من الانتقال بنجاح إلى العالم الحقيقي عبر نموذج رقمي مُحاكٍ (digital twin)، حيث بلغ معدل النجاح 78.3% في مهام رفع ذراعين.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
DexFlyWheel: إطار لتعزيز البيانات قابِل للتوسعة وذاتي التحسّن لمهام التلاعب الدقيق | الأوراق البحثية | HyperAI