العنوان المعدل: "TheAgentCompany: تقييم أداء الذكاء الاصطناعي في المهام العملية ببيئة العمل التقنية"
نحن نتفاعل مع الحواسيب بشكل يومي، سواء في حياتنا الشخصية أو المهنية، حيث يمكن إنجاز العديد من المهام عبر الوصول إلى الحواسيب والإنترنت. ومع التقدم المستمر في مجال النماذج اللغوية الكبيرة (LLMs)، شهدنا تطورًا سريعًا في الذكاء الصناعي، الذي يمكنه التفاعل مع البيئة المحيطة وتأثيرها. ولكن، كيف تؤدي هذه الوكلاء الذكية في تسريع أو تنفيذ المهام الوظيفية بشكل مستقل؟ الإجابة على هذا السؤال تحمل أهمية كبيرة للصناعات التي تسعى إلى دمج الذكاء الصناعي في عملياتها، وكذلك للسياسات الاقتصادية التي تحتاج إلى فهم الآثار المحتملة لاعتماد الذكاء الصناعي على سوق العمل. لقياس تقدم الذكاء الصناعي في أداء المهام العملية، قدمت دراسة حديثة أداة تقدير قابلة للتوسع تُدعى TheAgentCompany. هذه الأداة تهدف إلى تقييم وكالات الذكاء الصناعي التي تعمل بطريقة مشابهة للموظفين الرقميين، وذلك من خلال تصفح الإنترنت، كتابة الأكواد البرمجية، تشغيل البرامج، والتواصل مع الزملاء. تم تصميم بيئة محاكاة شاملة تحتوي على مواقع إلكترونية داخلية وبيانات، لتكون نموذجًا مُصغرًا لشركة برمجيات صغيرة، وتم إنشاء مجموعة من المهام التي يمكن أن يقوم بها موظفو مثل هذه الشركات. خلال الاختبارات، تم تقييم وكالات أساسية مدفوعة بواسطة نماذج لغوية ذات واجهات برمجة مغلقة وأخرى ذات أوزان مفتوحة. وقد كشفت النتائج أن الوكيل الأكثر قدرة كان قادرًا على إتمام 24% من المهام بشكل مستقل. هذه النتيجة تعكس صورة معقدة حول إمكانات استخدام وكالات النماذج اللغوية في التحول نحو أتمتة المهام. فبينما يمكن للأنظمة الذكية حل نسبة ملحوظة من المهام البسيطة في بيئات تشبه بيئة العمل الحقيقية، فإن المهام الأكثر تعقيدًا وطويلة الأمد ما زالت خارج نطاق القدرات الحالية لهذه الأنظمة. هذه النتائج تشير إلى أن الذكاء الصناعي يتقدم بخطى ثابتة في مساعدة البشر في إنجاز المهام الروتينية والبسيطة، مما قد يؤدي إلى زيادة الكفاءة وتحسين الإنتاجية. ومع ذلك، يظل هناك حاجة ملحة لتطوير تقنيات أكثر تقدمًا وذكاءً لمعالجة التحديات الأكثر تعقيدًا التي تواجه القطاعات المختلفة. كما أن هذه الدراسة تسلط الضوء على أهمية التقييم المستمر لقدرات الذكاء الصناعي في بيئات عمل حقيقية، لضمان تطوير الحلول المناسبة وتقييم آثارها على سوق العمل.
