مايكروسوفت تكشف عن وكيل صغير Fara-7B للأجهزة
أصدرت شركة مايكروسوفت نموذج الذكاء الاصطناعي المفتوح المصدر "فارا-7 ب"، وهو نموذج لغوي صغير متخصص يعمل محليًا على أجهزة الكمبيوتر الشخصية لتنفيذ مهام الاستخدام الحاسوبي، مثل التصفح التلقائي للمواقع الإلكترونية. يتميز هذا النموذج بحجم 7 مليار معامل، مما يجعله خفيفًا بما يكفي للتحليل المحلي دون الاعتماد على سحابة ضخمة، لكنه ينافس أنظمة أكبر حجمًا بكثير من حيث القدرة على التفاعل مع البيئات الرقمية. يعمل فارا-7 ب كحلقة متكاملة من الإدراك إلى التفكير ثم التنفيذ، حيث يعتمد على لوحات الشاشة كأواجهة برمجية أساسية. يأخذ النموذج لقطة شاشة، ويتنبأ بالإجراء التالي، ويصدر إحداثيات دقيقة لتحريك الماوس ولوحة المفاتيح دون الحاجة إلى نماذج ثانوية لقراءة كود الموقع أو استخدام أشجار الوصول. تم تدريب النموذج عبر تقنية "التكثيف" على 145 ألف مسار تخليق مولد باستخدام إطار عمل "ماجنتك ون" الخاص بمicrosoft، حيث قام فريق من النماذج الأكبر حجمًا باستكشاف الويب وحل المهام ثم سجل عملياته ليتم دمجها في هذا النموذج الصغير. تتضمن عملية العمل حلقة مستمرة: حيث يقوم النظام التنفيذي بتنفيذ الإجراء الذي يصدره النموذج، ثم يلتقط لقطة شاشة جديدة، ويعيد تغذيتها بالنموذج مع تاريخ المهمة المحدثة، ويستمر التكرار حتى اكتمال المهمة أو الوصول إلى "نقاط حرجة". هذه النقاط الحرجة تشمل عمليات الدفع، الحجز، أو الاتصال، حيث يتوقف النموذج تلقائيًا لطلب موافقة المستخدم أو إدخال معلومات حساسة مثل بيانات البطاقة الائتمانية، وهي سمة مدمجة في بيانات التدريب نفسها وليست إضافة خارجية. يأتي إطلاق هذا النموذج في وقت يتجه فيه الذكاء الاصطناعي نحو تمثيل بيئي أكثر تعقيدًا، حيث يُنظر إلى إتقان العالم الرقمي كخطوة أساسية قبل التوجيه نحو العالم المادي. يتيح فارا-7 ب دمج هذه القدرات في أجهزة الكمبيوتر المحمولة الشخصية عبر أدوات مثل "فارا-CLI" أو مع واجهات "ماجنتيك-يو آي"، مما يحول استخدامات الذكاء الاصطناعي من تجارب باهظة الثمن ومعقدة إلى أدوات عملية للاستخدام اليومي. مع ذلك، فإن صغر حجم النموذج لا يعني بالضرورة تقليل سطح الهجوم الأمني. ينطوي الاعتماد على التصور البصري المباشر مع التنبؤ بالمواقع الحركية على مخاطر أمان متجذرة في نماذج الاستخدام الحاسوبي الأخرى، مثل الهجمات الخادعة أو التلاعب السلوكي، حيث يصبح النموذج هو المسؤول عن الإدراك والتنفيذ في آن واحد دون طبقة حماية وسيطة. لذلك، تؤكد مايكروسوفت في وثائقها الرسمية أن الإصدار تجريبية ويجب استخدامه ضمن بيئات معزولة ومع مراقبة التنفيذ، مع تجنب النطاقات عالية الخطورة أو البيانات الحساسة. يمثل هذا الإطلاق تحولًا استراتيجيًا في مسار التطوير، حيث يثبت أن القدرة على قيادة المتصفح أصبحت متاحة لموديلات صغيرة محليًا، مما يغير قصة النشر من أنظمة متعددة العوامل المعتمدة على السحابة إلى أدوات فردية تعمل محليًا. بينما تظهر الأرقام في الاختبارات المعيارية قدرات انطباعية، لا يزال هناك فجوة كبيرة بين الأداء في المختبر والفعالية في التطبيقات الواقعية، لكن النجاح في تحقيق هذه الوظيفة بنموذج 7 مليار معلم يفتح الباب أمام تبني أوسع للوكلاء الذكيين في المستقبل القريب.
