HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 2 أشهر

OpenHA: سلسلة من النماذج الهيكلية الوكيلة المفتوحة المصدر في ماينكرافت

Zihao Wang Muyao Li Kaichen He Xiangyu Wang Zhancun Mu Anji Liu Yitao Liang

OpenHA: سلسلة من النماذج الهيكلية الوكيلة المفتوحة المصدر في ماينكرافت

الملخص

يُعد اختيار فضاءات الإجراءات تحديًا حاسمًا وغير محلول حتى الآن في تطوير وكالات قادرة على التدريب بشكل كامل من البداية إلى النهاية. تقدم هذه الورقة مقارنةً واسعة النطاق ونظامية لأهم فضاءات الإجراءات المجردة ومحولات الرموز (tokenizers) المستخدمة في نماذج الوكالات البصرية-اللغوية-الإجراءية (VLA) أو النماذج الهرمية داخل بيئة مينكرافت المفتوحة النطاق. تُظهر تحليلنا أن لا يوجد فضاء إجراءات واحد هو الأفضل عالميًا؛ بل إن أفضل تعميم يعتمد بشدة على المهمة، مما يخلق معضلة في بناء وكالات عامة. ولحل هذه المشكلة، نقدّم إطار عمل جديد يُسمى "سلسلة الإجراءات" (Chain of Action - CoA)، الذي يوحّد التخطيط على المستوى العالي والتحكم على المستوى المنخفض ضمن نموذج VLA واحد متكامل. ويُعامل CoA الإجراء المجرد ليس كأمر موجه لسياسة منفصلة، بل كخطوة تفكير وسيطة – مشابهة لسلسلة التفكير (chain of thought) – توجّه إنشاء الإجراء النهائي القابل للتنفيذ. علاوةً على ذلك، نُظهر أن الوكالة من نوع "كل شيء في واحد" (All-in-One)، التي تم تدريبها على مزيج متنوع من فضاءات الإجراءات باستخدام منهجية CoA، تتعلم سياسة أكثر متانة وقابلية للتوسع. ويحقق هذا الوكيل المُوحّد حالة جديدة من التقدّم في الأداء، متفوّقًا على النماذج القوية والمتخصصة السابقة من حيث معدل نجاح المهام الإجمالي. ولتعزيز البحث القابل للتكرار، نُطلق مجموعة OpenHA (Open Hierarchical Agents)، التي تشمل معيارنا الشامل الذي يضم أكثر من 800 مهمة مختلفة، وبيانات مُختارة بعناية، وشفرة المصدر، وجميع نقاط التحقق المُدرّبة مسبقًا، متاحة عبر الرابط التالي: https://url

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
OpenHA: سلسلة من النماذج الهيكلية الوكيلة المفتوحة المصدر في ماينكرافت | الأوراق البحثية | HyperAI