غوغل ديب مايند تعزز إطار السلامة المتقدمة لمواجهة مخاطر الذكاء الاصطناعي المتقدم
أعلنت شركة جوجل ديب مايند عن تحديث نسخة ثالثة من إطارها الأمني للذكاء الاصطناعي المتقدم (Frontier Safety Framework)، كجزء من التزامها بتطوير تقنيات الذكاء الاصطناعي بمسؤولية، مع التركيز على التصدي للمخاطر الجسيمة الناتجة عن النماذج القوية. يأتي هذا التحديث استجابةً لتطورات متسارعة في مجال الذكاء الاصطناعي، التي تُحدث ثورة في مجالات متعددة مثل الرياضيات والبيولوجيا والتعليم المخصص، مع الحاجة إلى آليات رقابة متقدمة لضمان سلامة هذه التقنيات. أبرز التطورات في الإطار الجديد تتمثل في إضافة مستوى جديد يُعرف بـ"القدرة الحاسمة" (Critical Capability Level - CCL) مخصص لمواجهة مخاطر التلاعب الضار، حيث تُعرّف هذه القدرة كإمكانيات قوية في النماذج الذكية تُستخدم لتعديل المعتقدات والسلوكيات بشكل منهجي ومتكرر في سياقات عالية الأهمية، مثل السياسة أو الصحة النفسية، ما قد يؤدي إلى أضرار جسيمة على نطاق واسع. ويعتمد هذا الإدخال على أبحاث سابقة لفهم آليات التلاعب في الذكاء الاصطناعي التوليدي، وستواصل ديب مايند استثمارًا مكثفًا في هذا المجال لتحسين قياس وفهم المخاطر. كما تم توسيع الإطار لمعالجة مخاطر "الانحراف التوجيهي" (misalignment)، أي حالات قد يُظهر فيها نموذج ذكاء اصطناعي سلوكًا غير متوافق مع أهداف البشر، بما في ذلك القدرة على التلاعب بعمليات التحكم أو إيقاف النموذج. وقد تم تطوير إجراءات جديدة لرصد المخاطر المرتبطة بقدرات التفكير الأداة (instrumental reasoning)، وتم توسيع نطاق تطبيق هذه المعايير لتشمل النماذج التي قد تسهم في تسريع تطوير الذكاء الاصطناعي إلى مستويات تهدد الاستقرار. لضمان السلامة، تُجرى مراجعات شاملة للحالات الأمنية (safety case reviews) قبل أي إطلاق خارجي عند الوصول إلى مستويات محددة من القدرات، مع تقييم دقيق لخفض المخاطر إلى مستويات قابلة للإدارة. كما تم توسيع هذا النهج ليشمل التوظيف الداخلي الكبير للنماذج المتقدمة، التي قد تمثل خطرًا في بيئات التطوير. تم تحسين عملية تقييم المخاطر لتكون أكثر دقة، من خلال توضيح آلية التقييم الشاملة التي تشمل تحديد المخاطر بشكل منهجي، وتحليل القدرات بدقة، واتخاذ قرارات صريحة حول قبول المخاطر. وتم تطوير هذه العملية بناءً على تقييمات مبكرة، مع الحفاظ على تطبيق إجراءات وقائية وتدابير أمنية في جميع مراحل تطوير النماذج. يُعد هذا التحديث خطوة مهمة نحو بناء إطار مرن وقائم على الأدلة لمواكبة التطورات السريعة في الذكاء الاصطناعي، خصوصًا مع التوجه نحو الذكاء الاصطناعي العام (AGI). وتعتبر ديب مايند أن تحقيق فوائد الذكاء الاصطناعي التحويلي يتطلب ليس فقط تقدمًا تقنيًا، بل أيضًا هيكلًا قويًا للحد من المخاطر. وتعمل الشركة على مواصلة تطوير الإطار بالاستناد إلى الأبحاث الجديدة، والمشاركة مع الجهات المعنية في القطاعات الصناعية والأكاديمية والحكومية، بهدف بناء مستقبل آمن ومسؤول للذكاء الاصطناعي.