HyperAIHyperAI
منذ 15 أيام

التحفيز المُتسلسل للتفكير يُحفّز التفكير الاستنتاجي في النماذج اللغوية الكبيرة

Jason Wei, Xuezhi Wang, Dale Schuurmans, Maarten Bosma, Brian Ichter, Fei Xia, Ed Chi, Quoc Le, Denny Zhou
التحفيز المُتسلسل للتفكير يُحفّز التفكير الاستنتاجي في النماذج اللغوية الكبيرة
الملخص

نستعرض كيف أن إنشاء سلسلة من التفكير — أي سلسلة من الخطوات الاستنتاجية الوسيطة — يُحسّن بشكل كبير قدرة النماذج اللغوية الكبيرة على أداء التفكير المعقد. وتحديدًا، نُظهر كيف تظهر هذه القدرات الاستنتاجية بشكل طبيعي في النماذج اللغوية الكبيرة بما يكفي من خلال طريقة بسيطة تُسمى "التحفيز بسلسلة التفكير"، حيث يتم توفير عدد قليل من الأمثلة التوضيحية لسلسلة التفكير كأمثلة توضيحية في عملية التحفيز. وقد أظهرت التجارب على ثلاث نماذج لغوية كبرى أن التحفيز بسلسلة التفكير يُحسّن الأداء في مجموعة متنوعة من المهام التي تتطلب التفكير العددي، والمنطقي العام، والرمزي. وقد تكون المكاسب التجريبية ملحوظة جدًا. على سبيل المثال، فإن التحفيز بسلسلة تفكير مكوّنة من ثماني أمثلة فقط على نموذج لغوي بـ 540 مليار معلمة، يُحقّق دقةً من الدرجة الأولى في معيار GSM8K الخاص بمشاكل الكلمات الرياضية، متفوّقًا حتى على نموذج GPT-3 المُعدّل (fine-tuned) باستخدام مُحقّق (verifier).

التحفيز المُتسلسل للتفكير يُحفّز التفكير الاستنتاجي في النماذج اللغوية الكبيرة | أحدث الأوراق البحثية | HyperAI