Command Palette
Search for a command to run...
علامات مائية في السياق لـ LLMs
علامات مائية في السياق لـ LLMs
Yepeng Liu Xuandong Zhao Christopher Kruegel Dawn Song Yuheng Bu
الملخص
أبرز الاستخدام المتزايد لنماذج اللغة الكبيرة (LLMs) في التطبيقات الحساسة الحاجة إلى تقنيات فعالة للعلامة المائية (Watermarking) لضمان أصالة النص المُولَّد بواسطة الذكاء الاصطناعي ومسؤوليته. غير أن معظم طرق العلامة المائية الحالية تتطلب الوصول إلى عملية فك التشفير (Decoding Process)، مما يحد من قابليتها للتطبيق في السياقات الواقعية. ومن الأمثلة التوضيحية على ذلك استخدام نماذج اللغة الكبيرة من قِبَل مراجعين غير نزيهين في سياق المراجعة الأقران الأكاديمية، حيث لا يملك منظمو المؤتمرات أي وصول إلى النموذج المستخدم، مع بقائهم بحاجة إلى كشف المراجعات المُولَّدة بواسطة الذكاء الاصطناعي.استجابةً لهذه الفجوة، نقترح تقنية "العلامة المائية في السياق" (In-Context Watermarking - ICW)، التي تدمج العلامات المائية في النصوص المُولَّدة حصريًا من خلال هندسة المطالبات (Prompt Engineering)، مستفيدةً من قدرات نماذج اللغة الكبيرة على التعلم في السياق (In-Context Learning) وعلى اتباع التعليمات. وقد قمنا بدراسة أربع استراتيجيات للعلامة المائية في السياق (ICW) على مستويات متفاوتة من الدقة (Granularity)، مع ربط كل استراتيجية بطريقة كشف مصممة خصيصًا لها. كما حللنا إعداد حقن المطالبات غير المباشر (Indirect Prompt Injection - IPI) كدراسة حالة محددة، حيث تُفعَّل العلامة المائية بشكل خفي عبر تعديل وثائق الإدخال، مثل المخطوطات الأكاديمية.وتؤكد تجاربنا جدوى تقنية العلامة المائية في السياق (ICW) كنهج عملي ومحايد من حيث النموذج (Model-agnostic) للعلامة المائية. وعلاوةً على ذلك، تشير نتائجنا إلى أنه مع تزايد كفاءة نماذج اللغة الكبيرة (LLMs)، فإن تقنية العلامة المائية في السياق (ICW) تُمثل اتجاهًا واعدًا نحو إسناد المحتوى على نطاق واسع وبطريقة يمكن الوصول إليها بسهولة.