HyperAIHyperAI

Command Palette

Search for a command to run...

إطار عمل توليد البيانات DexFlyWheel

Date

منذ 2 أشهر

Organization

Paper URL

2509.23829

تم اقتراح DexFlyWheel في سبتمبر 2025 من قبل جامعة بكين ومعهد هاربين للتكنولوجيا وPsiBot، وتم نشر نتائج البحث ذات الصلة في الورقة "DexFlyWheel: إطار عمل لتوليد البيانات قابل للتطوير والتحسين الذاتي للتلاعب الدقيق"، تم قبوله كـSpotlight بواسطة NeurIPS 2025.

DexFlyWheel هو إطار عمل لتوليد البيانات قابل للتطوير، يستخدم حلقة ذاتية التحسين لإثراء تنوع البيانات باستمرار. يتميز الإطار بميزتين تصميميتين رئيسيتين: IL + Residual RL لتوليد بيانات متنوعة شبيهة بالبيانات البشرية. وبشكل أكثر تحديدًا، يُشكل IL وResidual RL، إلى جانب تفكيك السياسات وزيادة البيانات، حلقة ذاتية التحسين. في كل تكرار، تُولّد السياسة مسارات، تُحسّن بدورها في سيناريوهات متزايدة التنوع، ثم تُغذّى في التكرار التالي. تُنشئ هذه الحلقة تأثير دولاب الموازنة، مما يُوسّع تنوع البيانات تدريجيًا، ويُحسّن قدرات تعميم السياسات، ويتطور إلى أداة توليد بيانات متينة وقابلة للتعميم.

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
إطار عمل توليد البيانات DexFlyWheel | Wiki | HyperAI