Command Palette
Search for a command to run...
Adam Tauman Kalai Ofir Nachum Santosh S. Vempala Edwin Zhang

الملخص
كما يواجه الطلاب صعوبة في الإجابة على أسئلة الامتحان الصعبة، فإن النماذج اللغوية الكبيرة أحيانًا تُقدِّم تكهنات عندما تكون غير متأكدة، مما يؤدي إلى إصدار عبارات واقعية لكنها خاطئة بدلًا من الاعتراف بالغموض. تستمر هذه الظاهرة، المعروفة بـ"الهلوسة"، حتى في أكثر الأنظمة تقدمًا، وتُضعف الثقة بها. نحن نجادل بأن النماذج اللغوية تُنتج هلوسات لأن إجراءات التدريب والتقييم تُكافئ التخمين بدلًا من الاعتراف بالغموض، ونحلل الأسباب الإحصائية التي تؤدي إلى هذه الهلوسات في سلسلة التدريب الحديثة. لا يجب أن تكون الهلوسات ظاهرة غامضة — فهي تنشأ ببساطة كأخطاء في التصنيف الثنائي. فإذا لم يمكن التمييز بين العبارات الخاطئة والحقائق، فإن الهلوسات في النماذج اللغوية المُدرَّبة مسبقًا ستظهر نتيجة للضغوط الإحصائية الطبيعية. ثم نجادل بأن الهلوسات تستمر بسبب الطريقة التي تُقيَّم بها معظم النماذج — فتُحسَّن النماذج لتصبح ناجحة في الامتحانات، وبما أن التخمين عند الغموض يُحسِّن الأداء في الامتحان، فإن هذا السلوك يُشجَّع. يمكن معالجة هذه "الوباء" الناتج عن معاقبة الاستجابات الغامضة فقط من خلال تدخل سوسيوتقني: إعادة تقييم نقاط المعايير الحالية التي لا تتماشى مع الواقع ولكنها تهيمن على جداول التصنيف، بدلًا من إدخال تقييمات إضافية للهلوسات. وقد يؤدي هذا التغيير إلى توجيه المجال نحو أنظمة ذكاء اصطناعي أكثر موثوقية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.