التعلم للثقة: التكيف بايزي مع موثوقية المُقترح المتفاوتة في اتخاذ القرارات التسلسلية
Dylan M. Asmar Mykel J. Kochenderfer

الملخص
يمكن للوكالات المستقلة التي تعمل في مهام اتخاذ القرار التسلسلي ضمن بيئات محفوفة بالغموض أن تستفيد من الاقتراحات الخارجية للإجراءات، التي توفر توجيهًا قيمًا لكنها تختلف بطبيعتها في مدى موثوقيتها. تفترض الطرق الحالية لدمج هذه الاقتراحات عادةً وجود معايير ثابتة ومعروفة لجودة المُقترح، مما يحد من إمكانية تطبيقها عمليًا. نقدّم إطارًا يتعلم ديناميكيًا ويتكيف مع التغيرات في موثوقية المُقترحات في البيئات الجزئية الملاحظة. أولاً، نُدمج جودة المُقترح مباشرة في تمثيل اعتقاد الوكالة، مما يمكّن الوكالة من استنتاج مدى موثوقية الاقتراحات وتعديل درجة الاعتماد عليها من خلال الاستدلال بايزي على أنواع المُقترحات. ثانيًا، نُقدّم فعلًا صريحًا يُسمى "اطلب"، يسمح للوكالات بطلب الاقتراحات بشكل استراتيجي في اللحظات الحاسمة، مع تحقيق توازن بين الفوائد المعرفية المُحصَّلة وتكاليف الحصول على هذه الاقتراحات. أظهرت النتائج التجريبية أداءً قويًا في ظل تباين جودة المُقترحات، والتكيّف مع التغيرات في الموثوقية، وإدارة استراتيجية لطلبات الاقتراحات. يُعد هذا العمل أساسًا لتعزيز التعاون البشري-الوكلائي المُتكيف، من خلال معالجة عدم اليقين الناتج عن الاقتراحات في بيئات محفوفة بالغموض.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.