ReAct: دمج التفكير والعمل في نماذج اللغة

بينما أظهرت النماذج اللغوية الكبيرة (LLMs) قدرات مذهلة في مجموعة متنوعة من المهام المتعلقة بفهم اللغة واتخاذ القرارات التفاعلية، فإن قدراتها في التفكير (مثل التحفيز بالسياق المتسلسل) والتنفيذ (مثل توليد خطط الإجراءات) تم دراستها بشكل رئيسي كمواضيع منفصلة. في هذه الورقة، نستكشف استخدام النماذج اللغوية الكبيرة لتوليد آثار التفكير والإجراءات الخاصة بالمهام بشكل متناوب، مما يُتيح تكاملًا أعمق بين العمليتين: حيث تساعد آثار التفكير النموذج على استنتاج خطط الإجراءات، ومتابعتها، وتحديثها، بالإضافة إلى التعامل مع الحالات الاستثنائية، في حين تتيح الإجراءات للنموذج التفاعل مع المصادر الخارجية، مثل قواعد المعرفة أو البيئات، لجمع معلومات إضافية. نطبق منهجنا، الذي أطلقنا عليه اسم ReAct، على مجموعة متنوعة من المهام اللغوية واتخاذ القرار، ونُظهر فعاليته مقارنة بالأساليب المتطورة الحالية، بالإضافة إلى تحسين قابلية الفهم البشري وزيادة الثقة مقارنة بالأساليب التي لا تضم مكونات التفكير أو التنفيذ. بشكل ملموس، على مهام الإجابة عن الأسئلة (HotpotQA) وتحقق الحقائق (Fever)، تتجاوز ReAct مشكلات التخيل (hallucination) والانتشار الخاطئ للخطأ التي تُعد شائعة في التفكير بالسياق المتسلسل من خلال التفاعل مع واجهة برمجة تطبيقات بسيطة لويكيبيديا، وتنشئ مسارات حل مهام تشبه ما يفعله الإنسان، وهي أكثر قابلية للفهم من الأساليب الأخرى التي لا تضم آثار تفكير. وعلى مBenchmarkين تفاعليين لاتخاذ القرار (ALFWorld وWebShop)، تتفوق ReAct على الأساليب القائمة على التقليد والتعلم التكاملي بنسبة نجاح مطلقة تبلغ 34% و10% على التوالي، مع استخدام مثال واحد أو اثنين فقط ضمن السياق (in-context). موقع المشروع مع الكود: https://react-lm.github.io