منذ 6 أشهر

الملخص

تماماً مثل نماذج اللغة (LMs)، فهي عرضة لعمليات "التحايل على المكافأة داخل السياق"، حيث تستغل هذه النماذج الثغرات الموجودة في المواصفات أو المعايير المكتوبة المُلوثة أو الخاطئة، من أجل تحقيق نقاط عالية دون التعبير عن النية الحقيقية للمستخدم. نقدم "التصحيح الذاتي للمواصفات" (SSC)، وهو إطار عمل جديد يتم تطبيقه أثناء الاستنتاج (test-time)، يتيح لنموذج اللغة اكتشاف الثغرات داخل مواصفاته التوجيهية وإصلاحها. يعتمد SSC على عملية استنتاج متعددة المراحل، حيث يقوم النموذج أولاً بإنشاء إجابة بناءً على مواصفة قد تكون ملوثة، ثم يقيم ناتجها، وأخيراً يقوم بتعديل مواصفته الخاصة لاستبعاد الثغرة القابلة للاستغلال. تُنتج بعد ذلك إجابة أكثر صلابة باستخدام هذه المواصفة المُصلحة ذاتياً. في تجارب تشمل مهام الكتابة الإبداعية ومهام البرمجة المنظمة (agentic coding) مع عدة نماذج للغة، نُظهر أن النماذج تبدأ بتحايل المواصفات الملوثة في 50-70% من الحالات، لكن عملية SSC تقلل من هذه الثغرة بنسبة تزيد على 90%. يحدث هذا الإصلاح الديناميكي أثناء الاستنتاج، ولا يتطلب أي تعديل للوزن، ويؤدي إلى سلوك نموذج أكثر توافقاً مع الأهداف. الشفرة المصدرية في: https://github.com/vicgalle/specification-self-correction.

ملف PDF المصدر عرض الكود

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Víctor Gallego

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Víctor Gallego

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Víctor Gallego

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التصحيح الذاتي للمواصفات: تخفيف تلاعب المكافأة في السياق من خلال تحسين في وقت الاختبار

Víctor Gallego

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التصحيح الذاتي للمواصفات: تخفيف تلاعب المكافأة في السياق من خلال تحسين في وقت الاختبار

Víctor Gallego

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

التصحيح الذاتي للمواصفات: تخفيف تلاعب المكافأة في السياق من خلال تحسين في وقت الاختبار

Víctor Gallego

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters