سلسلة التفكير المستمر جوز الهند
جوز الهند (سلسلة الفكر المستمر) هو نموذج جديد اقترحه باحثون من ميتا وجامعة كاليفورنيا، سان دييغو في ديسمبر 2024. ويهدف إلى استكشاف إمكانات التفكير في نماذج اللغة الكبيرة (LLMs) في المساحات الكامنة غير المقيدة. وتنعكس النتائج المحددة في الورقة البحثية "تدريب نماذج اللغة الكبيرة على التفكير في مساحة كامنة مستمرة"وسط.
يحرر جوز الهند عملية التفكير من الفضاء اللغوي التقليدي ويسمح للنموذج بالتفكير بشكل مباشر في الفضاء الكامن المستمر. لم يعد هذا النهج يعتمد على رأس نموذج اللغة وطبقة التضمين لربط الحالات المخفية برموز اللغة، بل يقوم بدلاً من ذلك بتضمين الحالة المخفية الأخيرة للنموذج (أي الفكر المستمر) بشكل مباشر كمدخل للرمز التالي. تتيح هذه التعديلات للنموذج القدرة على التفكير دون قيود اللغة الطبيعية، ولأن التفكير المستمر قابل للتفاضل بشكل كامل، يمكن تحسين النظام من البداية إلى النهاية من خلال الانحدار التدريجي.
وذكرت الورقة البحثية أن Coconut يتفوق على Chain of Thought (CoT) التقليدية في بعض مهام التفكير المنطقي التي تتطلب الكثير من التراجع، ويولد عددًا أقل من الرموز أثناء عملية التفكير، مما يشير إلى أن التفكير في الفضاء الكامن له مزايا واضحة في المهام المعقدة التي تتطلب تخطيطًا مكثفًا.