HyperAIHyperAI
منذ 17 أيام

التعلم التكاملي للأشجار القرارية القابلة للتفسير

Leonardo Lucio Custode, Giovanni Iacca
التعلم التكاملي للأشجار القرارية القابلة للتفسير
الملخص

في العقد الماضي، حققت تقنيات التعلم بالتعزيز أداءً يعادل مستوى الإنسان في عدة مهام. ومع ذلك، في السنوات الأخيرة، ظهرت الحاجة إلى التفسيرية: نرغب في القدرة على فهم كيفية عمل النظام وأسباب قراراته. ليس فقط نحن بحاجة إلى التفسيرية لتقييم سلامة الأنظمة المنتجة، بل نحتاج أيضًا إليها لاستخلاص معرفة حول المشكلات غير المعروفة. وعلى الرغم من وجود بعض التقنيات التي تُحسّن أشجار القرار للتعلم بالتعزيز، إلا أنها غالبًا ما تستخدم خوارزميات جشعة أو لا تستفيد من المكافآت التي يوفرها البيئة، مما يعني أن هذه التقنيات قد تعلق بسهولة في حلول محلية غير مثلى. في هذا العمل، نقترح نهجًا جديدًا للتعلم بالتعزيز القابل للتفسير باستخدام أشجار القرار. نقدّم خطة تحسين ثنائية المستوى تدمج مزايا الخوارزميات التطورية مع مزايا تعلم Q. وبهذا نُفكك المشكلة إلى مشكلتين فرعيتين: مشكلة إيجاد تجزئة ذات معنى وفائدة لفضاء الحالة، ومشكلة ربط إجراء معين بكل حالة. وقد تم اختبار الطريقة المقترحة على ثلاث معايير معروفة في التعلم بالتعزيز، حيث أظهرت نتائج تنافسية مقارنة بالحالة الحالية من حيث الأداء والتفسيرية. وأخيرًا، نُجري دراسة تحليلية (أبليشن ستودي) تؤكد أن استخدام خطة التحسين ثنائية المستوى يُحسّن الأداء في البيئات غير البسيطة مقارنة بأسلوب التحسين ذي الطبقة الواحدة.

التعلم التكاملي للأشجار القرارية القابلة للتفسير | أحدث الأوراق البحثية | HyperAI