HyperAIHyperAI

Command Palette

Search for a command to run...

سلسلة التفكير المستمر جوز الهند

التاريخ

منذ 10 أشهر

جوز الهند (سلسلة الفكر المستمر) هو نموذج جديد اقترحه باحثون من ميتا وجامعة كاليفورنيا، سان دييغو في ديسمبر 2024. ويهدف إلى استكشاف إمكانات التفكير في نماذج اللغة الكبيرة (LLMs) في المساحات الكامنة غير المقيدة. وتنعكس النتائج المحددة في الورقة البحثية "تدريب نماذج اللغة الكبيرة على التفكير في مساحة كامنة مستمرة"وسط.

يحرر جوز الهند عملية التفكير من الفضاء اللغوي التقليدي ويسمح للنموذج بالتفكير بشكل مباشر في الفضاء الكامن المستمر. لم يعد هذا النهج يعتمد على رأس نموذج اللغة وطبقة التضمين لربط الحالات المخفية برموز اللغة، بل يقوم بدلاً من ذلك بتضمين الحالة المخفية الأخيرة للنموذج (أي الفكر المستمر) بشكل مباشر كمدخل للرمز التالي. تتيح هذه التعديلات للنموذج القدرة على التفكير دون قيود اللغة الطبيعية، ولأن التفكير المستمر قابل للتفاضل بشكل كامل، يمكن تحسين النظام من البداية إلى النهاية من خلال الانحدار التدريجي.

وذكرت الورقة البحثية أن Coconut يتفوق على Chain of Thought (CoT) التقليدية في بعض مهام التفكير المنطقي التي تتطلب الكثير من التراجع، ويولد عددًا أقل من الرموز أثناء عملية التفكير، مما يشير إلى أن التفكير في الفضاء الكامن له مزايا واضحة في المهام المعقدة التي تتطلب تخطيطًا مكثفًا.

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp