HyperAIHyperAI

Command Palette

Search for a command to run...

موزايك ليكس يحد من تسرب بيانات وكلاء البحث

كشفت دراسة حديثة تحت مسمى MosaicLeaks عن ثغرة أمنية جوهرية في وكلاء البحث الذكي المتقدمين، حيث تؤدي دمج البيانات المحلية الخاصة مع أدوات البحث الخارجي عبر الإنترنت إلى تسريب معلومات سرية بشكل غير مقصود. تعرف الظاهرة بـتأثير الموزاييك، حيث تبدو كل استعلام ويب على حدة بريئة، لكن تسجيلها التراكمي يتيح للمراقبين إعادة تجميع أجزاء مختلفة من المعلومات الخاصة لاستنتاج حقائق حساسة لم يُنشر عنها شيء. صمم باحثون، بقيادة ألكسندر غوران وفريقه البحثي، منصة تقييم تتكون من ألف سلسلة بحثية متعددة المراحل، تجمع بين وثائق مؤسسية محلية ومحركات بحث عامة. تهدف المنصة لقياس ثلاثة مستويات من التسريب: تسريب النوايا البحثية، تسريب الإجابات على أسئلة محددة، وتسريب المعلومات الكاملة دون توجيه مسبق. أظهرت التجارب على نماذج مثل Qwen3-4B أن الوكيل يسرب معلومات في نسبة تصل إلى 34 في المئة من الحالات، وأن مجرد إضافة تعليمات نصية تمنع التسريب لم يكن فعالاً بل أدى غالباً لتراجع الأداء المهني للوكيل. ما زاد الخطورة هو ملاحظة الباحثين أن تحسين الوكيل لأداءه عبر التدريب على المهام فقط رفع نسبة التسريب إلى أكثر من 51 في المئة، إذ تعلّم النموذج حشر المزيد من السياقات الحساسة في استعلاماته لتحسين دقة النتائج. لمواجهة هذه المعضلة، قدم الفريق منهجية تدريب بالتعزيز المعروفة بـ PA-DR، تجمع بين مكافآت المهام السياقية والمكافآت الخصوصية المتعلمة. تعمل المكافآت السياقية على تقييم كل خطوة من خطوات التخطيط والبحث بشكل مستقل، بينما تستخدم خوارزمية لتقدير خطر التسريب في كل استعلام ويب وتطبق عقوبات تدريبية فورية على القرارات التي تكشف البيانات. أسفرت المنهجية الجديدة عن نتائج قياسيه واضحة، حيث انخفضت نسبة تسريب المعلومات أو الإجابات من 34 في المئة إلى 9.9 في المئة فقط، مع الحفاظ على نسبة نجاح السلاسل البحثية الصارمة عند 58.7 في المئة، متجاوزة بذلك أداء النموذج الأساسي. كما أثبتت الطريقة كفاءة عينة أعلى، حيث حققت نفس مستوى الأداء المهني باستخدام أقل من سدس عدد العينات المطلوبة بطرق التدريب التقليدية. يخلص فريق البحث إلى أن ضمان خصوصية وكلاء الذكاء الاصطناعي لا يمكن تحقيقه عبر التعريفات النصية أو الحواجز البسيطة، بل يتطلب بنية تدريبية جوهرة تصمم لموازنة الدقة مع حماية البيانات في كل خطوة بحثية. تبقى هذه النتائج مرجعاً أولياً للمختبرات التي تطور أنظمة بحث ذاتي، مع التأكيد على الحاجة لمعايير أوسع لاختبار هذه الآليات في بيئات النشر الواقعية المعقدة.

الروابط ذات الصلة