HyperAIHyperAI

Command Palette

Search for a command to run...

منذ 2 أشهر

تعليم النماذج الكبيرة للغة التخطيط: التدريب الموجه بالسياق المنطقي للتخطيط الرمزي

Pulkit Verma Ngoc La Anthony Favier Swaroop Mishra Julie A. Shah

تعليم النماذج الكبيرة للغة التخطيط: التدريب الموجه بالسياق المنطقي للتخطيط الرمزي

الملخص

أظهرت النماذج اللغوية الكبيرة (LLMs) قدرات مذهلة في مجموعة متنوعة من المهام، إلا أن قدرتها على أداء التخطيط الرمزي المنظم ما زالت محدودة، خاصة في المجالات التي تتطلب تمثيلات رسمية مثل لغة تعريف مجال التخطيط (PDDL). في هذه الورقة، نقدم إطارًا جديدًا للضبط بالتعليم يُسمى PDDL-Instruct، مصمم لتعزيز قدرات النماذج اللغوية الكبيرة في التخطيط الرمزي من خلال التفكير المنطقي المتسلسل (Chain-of-Thought). يركّز نهجنا على تعليم النماذج التفكير بدقة في مدى صلاحية الإجراءات، وانتقال الحالات، وصحة الخطة، باستخدام خطوات استدلال منطقية صريحة. من خلال تطوير نصوص تعليمية (Instruction Prompts) توجه النماذج عبر الخطوات المنطقية الدقيقة المطلوبة لتحديد متى يمكن تطبيق إجراء معين في حالة معينة، نمكّن النماذج من تصحيح خططها ذاتيًا من خلال التفكير الهيكلي. يبني الإطار مهارات التحقق بشكل منهجي من خلال تفكيك عملية التخطيط إلى سلاسل تفكير صريحة حول استيفاء الشروط المسبقة، وتطبيق الآثار، وحفظ المتغيرات الثابتة. أظهرت النتائج التجريبية في عدة مجالات للتخطيط أن النماذج المُدرَّبة باستخدام التفكير المتسلسل تتفوّق بشكل ملحوظ في التخطيط، حيث بلغت دقة التخطيط ما يصل إلى 94% على المعايير القياسية، مُحققة تحسنًا مطلقًا بنسبة 66% مقارنة بالنماذج الأساسية. تمثل هذه الدراسة خطوة مهمة في سد الفجوة بين القدرات العامة للتفكير لدى النماذج اللغوية الكبيرة والدقة المنطقية المطلوبة للتخطيط الآلي، مقدمةً اتجاهًا واعدًا لتطوير أنظمة ذكاء اصطناعي للتخطيط الأفضل.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
تعليم النماذج الكبيرة للغة التخطيط: التدريب الموجه بالسياق المنطقي للتخطيط الرمزي | الأوراق البحثية | HyperAI