الإجابة على الأسئلة من خلال الاستدلال الميتا على سلاسل تفكير متعددة

تُعد الأنظمة الحديثة لأسئلة الإجابة متعددة الخطوات (QA) عادةً ما تُفكّك الأسئلة إلى تسلسل من خطوات الاستدلال، تُعرف بسلسلة التفكير (Chain-of-Thought (CoT))، قبل الوصول إلى الإجابة النهائية. غالبًا ما يتم عينة عدة سلاسل ثم تجميع النتائج عبر آلية تصويت على الإجابات النهائية، لكن الخطوات الوسيطة تُهمل في هذه العملية. وعلى الرغم من أن هذه النهج تُحسّن الأداء، إلا أنها لا تأخذ بعين الاعتبار العلاقات بين الخطوات الوسيطة عبر السلاسل المختلفة، ولا تُقدّم تفسيرًا موحّدًا للإجابة المُتنبّأ بها. نقدّم هنا نهجًا يُسمّى الاستدلال متعدد السلاسل (Multi-Chain Reasoning (MCR))، والذي يُحفّز النماذج اللغوية الكبيرة على التفكير على مستوى أعلى (meta-reasoning) حول عدة سلاسل تفكير، بدلًا من تجميع إجاباتها. يُحلّل MCR سلاسل استدلال مختلفة، ويُدمج المعلومات بينها، ويختار أكثر الحقائق صلةً عند توليد التفسير والتنبؤ بالإجابة. وقد أظهر MCR تفوقًا على نماذج أساسية قوية في 7 مجموعات بيانات لأسئلة الإجابة متعددة الخطوات. علاوةً على ذلك، كشف التحليل الذي أجريناه أن تفسيرات MCR تتميز بجودة عالية، ما يمكّن البشر من التحقق من صحة إجاباته.