iSeal: التوقيع الرقمي المشفر للتحقق الموثوق من الملكية في نماذج اللغة الكبيرة
iSeal: التوقيع الرقمي المشفر للتحقق الموثوق من الملكية في نماذج اللغة الكبيرة
Zixun Xiong Gaoyi Wu Qingyang Yu Mingyu Derek Ma Lingfeng Yao Miao Pan Xiaojiang Du Hao Wang

الملخص
بالنظر إلى التكلفة العالية لتدريب نماذج اللغة الكبيرة (LLM) من الصفر، أصبح حماية الملكية الفكرية (IP) الخاصة بهذه النماذج أمرًا بالغ الأهمية. وبما أن نمط التحقق من ملكية النموذج يُعد المعيار القياسي لتحديد ملكية النموذج، فإن التوقيع الرقمي (fingerprinting) للنماذج يُعد عنصرًا حاسمًا في مواجهة هذا التحدي. تعتمد الطرق الحالية للتوقيع الرقمي على استخراج أو إدخال ميزات محددة للنموذج لتأكيد الملكية. غير أن هذه الطرق تتجاهل التهديدات المحتملة التي قد تحدث أثناء عملية التحقق، ما يجعلها غير فعّالة في حال امتلاك المُسْرِق للنموذج للتحكم الكامل في عملية استنتاج النموذج. في هذه البيئات، يمكن للمهاجمين مشاركة أزواج "مُحفِّز-استجابة" (prompt-response pairs) لتمكين "إلغاء تعلُّم" التوقيع الرقمي، أو تعديل الإخراج لتفادي التحقق من المطابقة الحرفية. نُقدِّم iSeal، وهي أول طريقة لتوقيع رقمي مصممة لضمان التحقق الموثوق في حال كان المُسْرِق للنموذج يتحكم في النموذج المشتبه به بطريقة نهائية (end-to-end). تُدمج iSeal ميزات فريدة في كل من النموذج الداخلي ووحدة خارجية، مع دعم ميكانيزم تصحيح الأخطاء واستراتيجية تحقق تعتمد على التشابه. تُعد هذه المكونات مقاومة لهجمات التحقق، بما في ذلك هجمات إلغاء تعلُّم التوقيع الرقمي المبنية على التآمر وتحريف الاستجابات، مع دعم نظري ونتائج تجريبية. تحقق iSeal معدل نجاح توقيع رقمي (FSR) يبلغ 100% على 12 نموذجًا لغويًا كبيرًا، أمام أكثر من 10 هجمات، في حين تفشل الطرق المعيارية في ظل هجمات إلغاء التعلُّم وتحريف الاستجابات.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.