علماء يكشفون عن أول دفاع فعّال ضد هجمات تحليل رموز الذكاء الاصطناعي لسرقة نماذج AI
أعلن باحثون من جامعة نورث كارولاينا الحكومية عن أول آلية دفاع فعالة ضد الهجمات التشفيرية التي تستهدف سرقة المعاملات الأساسية لنماذج الذكاء الاصطناعي، وهي هجمات تُعدّ من أسرع الطرق فعالية لاستخلاص الملكية الفكرية المضمنة في النماذج. ويشير الباحثون إلى أن هذه الهجمات، التي تُستخدم لاستخلاص المعاملات من الشبكات العصبية، تُعدّ تهديدًا متصاعدًا، وتمثّل خطرًا حقيقيًا على الأنظمة التجارية التي تعتمد على الذكاء الاصطناعي، مثل نماذج اللغة الكبيرة مثل ChatGPT. يُعدّ "الاستخراج التشفيري للمعاملات" طريقة رياضية تسمح لمهاجم بتحليل المدخلات والمخرجات لنظام ذكاء اصطناعي، ثم استخدام خوارزميات رياضية لاستنتاج قيم المعاملات التي تُشكّل أساس عمل النموذج. ورغم أن هذه الهجمات كانت تُعدّ ممكنة فقط ضد الشبكات العصبية حتى الآن، إلا أن هذه الفئة تمثل الغالبية العظمى من النماذج المستخدمة في الصناعة. الحل الجديد، الذي طوّره فريق بقيادة آيشين أيسو وأشلي كوريان، يعتمد على ملاحظة جوهرية: الهجمات التشفيرية تعتمد على التباين بين العصبونات (الوحدات الأساسية في الشبكة العصبية) ضمن الطبقات نفسها. وعندما تكون العصبونات متشابهة نسبيًا، تصبح عملية استخلاص المعاملات أكثر صعوبة. لذا، ابتكر الباحثون طريقة تدريب تُشجع على تشابه العصبونات في الطبقات المختلفة، مما يخلق ما وصفوه بـ"حاجز التشابه" الذي يعترض مسار الهجوم. وأكد الباحثون أن هذا التدريب لا يُؤثر على أداء النموذج، حيث أظهرت التجارب الأولية أن دقة النماذج التي تم تدريبها باستخدام هذه الآلية لم تتغير بأكثر من 1%، وقد تكون حتى أفضل في بعض الحالات. كما أثبتت الاختبارات أن النماذج المحمية لم تُستخرج منها المعاملات باستخدام الهجمات التشفيرية حتى بعد مدة تزيد عن يومين، بينما كانت الهجمات التقليدية تستغرق أقل من أربع ساعات لسرقة المعاملات من النماذج غير المحمية. إلى جانب التطبيق العملي، طوّر الفريق أيضًا إطارًا نظريًا يمكن من خلاله تقدير احتمالية نجاح الهجمات دون الحاجة إلى تنفيذها فعليًا، مما يوفر وسيلة لقياس مستوى الأمان النسبي للنماذج قبل تعرضها للهجوم. يُعتبر هذا الإنجاز خطوة مهمة نحو حماية الملكية الفكرية للذكاء الاصطناعي، خاصة مع التزايد المستمر للهجمات الإلكترونية. ورغم أن الباحثين يدركون أن المهاجمين قد يطورون طرقًا جديدة للتجاوز، إلا أنهم يأملون في توظيف هذه التقنية على نطاق واسع، وفتح المجال للتعاون مع القطاع الصناعي. كما سيُعرض البحث في مؤتمر NeurIPS في ديسمبر 2025، وهو أحد أبرز المؤتمرات العالمية في مجال معالجة المعلومات العصبية.
