إطار عمل توليد البيانات DexFlyWheel
تم اقتراح DexFlyWheel في سبتمبر 2025 من قبل جامعة بكين ومعهد هاربين للتكنولوجيا وPsiBot، وتم نشر نتائج البحث ذات الصلة في الورقة "DexFlyWheel: إطار عمل لتوليد البيانات قابل للتطوير والتحسين الذاتي للتلاعب الدقيق"، تم قبوله كـSpotlight بواسطة NeurIPS 2025.
DexFlyWheel هو إطار عمل لتوليد البيانات قابل للتطوير، يستخدم حلقة ذاتية التحسين لإثراء تنوع البيانات باستمرار. يتميز الإطار بميزتين تصميميتين رئيسيتين: IL + Residual RL لتوليد بيانات متنوعة شبيهة بالبيانات البشرية. وبشكل أكثر تحديدًا، يُشكل IL وResidual RL، إلى جانب تفكيك السياسات وزيادة البيانات، حلقة ذاتية التحسين. في كل تكرار، تُولّد السياسة مسارات، تُحسّن بدورها في سيناريوهات متزايدة التنوع، ثم تُغذّى في التكرار التالي. تُنشئ هذه الحلقة تأثير دولاب الموازنة، مما يُوسّع تنوع البيانات تدريجيًا، ويُحسّن قدرات تعميم السياسات، ويتطور إلى أداة توليد بيانات متينة وقابلة للتعميم.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.