HyperAIHyperAI

Command Palette

Search for a command to run...

التوافق يجعل نماذج اللغة معيارية، وليست وصفية.

Eilam Shapira Moshe Tennenholtz Roi Reichart

الملخص

تحسين محاذاة النماذج اللغوية بعد التدريب (post-training alignment) يهدف إلى مواءمة هذه النماذج مع إشارات التفضيل البشري، غير أن هذا الهدف لا يُكافئ نمذجة السلوك البشري الملاحظ. نقارن في هذه الدراسة 120 زوجًا من النماذج الأساسية والمُحاذاة بناءً على أكثر من 10,000 قرار بشري حقيقي في ألعاب استراتيجية متعددة الجولات، تشمل المساومة، والإقناع، والمفاوضات، وألعاب المصفوفة المتكررة. في هذه السياقات، تتفوق النماذج الأساسية على نظيراتها المُحاذاة في التنبؤ بالاختيارات البشرية بنسبة تقارب 10:1، وتُظهر هذه النتيجة متانة عبر عائلات النماذج المختلفة، وصيغ الـprompt المتنوعة، وتكوينات الألعاب المتعددة. غير أن هذا النمط ينقلب في السياقات التي يكون فيها السلوك البشري أكثر ميلاً إلى اتباع التنبؤات المعيارية (normative predictions): حيث تهيمن النماذج المُحاذاة على ألعاب الكتاب المدرسي ذات الجولة الواحدة عبر جميع الأنواع الـ12 المختبرة، وعلى خيارات اليانصيب غير الاستراتيجية، بل وتُظهر تفوقًا حتى داخل ألعاب الجولات المتعددة نفسها في الجولة الأولى، قبل أن يتراكم سجل التفاعل. يشير هذا النمط المرتبط بشروط الحدود إلى أن عملية المحاذاة تُحدث تحيزًا معياريًا (normative bias): فهي تحسّن دقة التنبؤ عندما يُغطى السلوك البشري بشكل جيد بواسطة الحلول المعيارية، لكنها تُضعف الدقة في البيئات الاستراتيجية متعددة الجولات، حيث يتشكل السلوك بواسطة ديناميكيات وصفية (descriptive dynamics) مثل المعاملة بالمثل، والانتقام، والتكيف المعتمد على التاريخ. تكشف هذه النتائج عن مقايضة جوهرية بين تحسين النماذج لاستخدامها من قِبَل البشر، واستخدامها كبدائل (proxies) لتمثيل السلوك البشري.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp