Command Palette
Search for a command to run...
OS-Sentinel: نحو تحسين السلامة في الوكالات الرسومية المتنقلة من خلال التحقق الهجيني في السير العمل الواقعية

الملخص
أظهرت الوكالات الحاسوبية المدعومة بنماذج الرؤية واللغة (VLMs) قدرات تشبه القدرات البشرية في تشغيل البيئات الرقمية مثل المنصات المحمولة. وعلى الرغم من الإمكانات الكبيرة التي تمتلكها هذه الوكالات في دفع عجلة الأتمتة الرقمية، فإن مخاوف متزايدة تتعلق بقدرتها على تنفيذ عمليات غير آمنة، مثل اختراق الأنظمة وتسريب الخصوصية، ما يشكل تهديدًا جوهريًا. ويعتبر اكتشاف هذه المخاوف المتعلقة بالسلامة في الفضاء التشغيلي الواسع والمعقد للبيئات المحمولة تحديًا جوهريًا، يظل حتى الآن مُهملًا بشكل حاد. ولإرساء قاعدة لبحوث السلامة في الوكالات المحمولة، نقدّم "MobileRisk-Live"، وهو بيئة محاكاة ديناميكية مصحوبة بBenchmark للكشف عن السلامة، يشتمل على مسارات واقعية مُعلّمة بدقة. وبما يُبنى على هذه البيئة، نقترح "OS-Sentinel"، وهو إطار جديد مُدمج للكشف عن السلامة، يُوَحِّد بشكل متكامل بين مُحقِّق رمزي (Formal Verifier) للكشف عن الانتهاكات الصريحة على مستوى النظام، ومحكم سياقي مُستند إلى نموذج VLM لتقييم المخاطر السياقية وسلوكيات الوكالة. تُظهر النتائج التجريبية أن "OS-Sentinel" يحقق تحسينات تتراوح بين 10% و30% مقارنةً بالنهج الحالية عبر عدة مقاييس. كما تُقدّم التحليلات الإضافية رؤى حاسمة تُسهم في تطوير وكالات متحركة مستقلة أكثر أمانًا وموثوقية.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.