منذ 15 أيام

التحفيز المُتسلسل للتفكير يُحفّز التفكير الاستنتاجي في النماذج اللغوية الكبيرة

Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter, Fei Xia, Ed Chi, Quoc Le, Denny Zhou

الملخص

نستعرض كيف أن إنشاء سلسلة من التفكير — أي سلسلة من الخطوات الاستنتاجية الوسيطة — يُحسّن بشكل كبير قدرة النماذج اللغوية الكبيرة على أداء التفكير المعقد. وتحديدًا، نُظهر كيف تظهر هذه القدرات الاستنتاجية بشكل طبيعي في النماذج اللغوية الكبيرة بما يكفي من خلال طريقة بسيطة تُسمى "التحفيز بسلسلة التفكير"، حيث يتم توفير عدد قليل من الأمثلة التوضيحية لسلسلة التفكير كأمثلة توضيحية في عملية التحفيز. وقد أظهرت التجارب على ثلاث نماذج لغوية كبرى أن التحفيز بسلسلة التفكير يُحسّن الأداء في مجموعة متنوعة من المهام التي تتطلب التفكير العددي، والمنطقي العام، والرمزي. وقد تكون المكاسب التجريبية ملحوظة جدًا. على سبيل المثال، فإن التحفيز بسلسلة تفكير مكوّنة من ثماني أمثلة فقط على نموذج لغوي بـ 540 مليار معلمة، يُحقّق دقةً من الدرجة الأولى في معيار GSM8K الخاص بمشاكل الكلمات الرياضية، متفوّقًا حتى على نموذج GPT-3 المُعدّل (fine-tuned) باستخدام مُحقّق (verifier).