تشذيب
تشذيبإنها طريقة لمنع شجرة القرار من التفرع. يتم استخدامه لحل مشكلة الإفراط في التجهيز في أشجار القرار، وبشكل أساسي لتبسيط شجرة القرار.
السبب وراء التقليم هو أنه أثناء عملية تعلم شجرة القرار، من أجل تصنيف عينات التدريب بشكل صحيح قدر الإمكان، سيتم إنشاء العقد بشكل مستمر، مما سيؤدي إلى وجود فروع كثيرة جدًا في شجرة القرار، وبالتالي تقليل الكفاءة. في هذا الوقت، هناك حاجة إلى عمليات التقليم لتبسيط شجرة القرار.
أهمية التقليم
تحتاج خوارزمية شجرة القرار إلى تحديد الحجم الأمثل للشجرة. الشجرة التي تكون كبيرة جدًا سوف تتناسب بشكل مفرط وسيكون من الصعب تعميمها على عينات جديدة. وفي الوقت نفسه، قد لا تتمكن شجرة صغيرة من التقاط المعلومات البنيوية حول مساحة العينة.
ومن الصعب أيضًا تحديد متى يجب إيقاف خوارزمية الشجرة لأنه من المستحيل معرفة ما إذا كانت عقدة واحدة ستقلل من معدل الخطأ. الاستراتيجية الأكثر شيوعًا هي تنمية الشجرة حتى تحتوي كل عقدة على عدد صغير من الحالات، ثم استخدام التقليم لإزالة العقد غير الضرورية.
أفكار وطرق التقليم
مبدأ التقليم يكمن في كيفية تحديد حجم شجرة القرار:
- استخدم مجموعات التدريب والتحقق لتقييم تأثير طرق التقليم على عقد التقليم؛
- استخدم مجموعة التدريب بأكملها للتدريب، ولكن استخدم الاختبارات الإحصائية لتحديد ما إذا كان تقليم العقد المحددة يحسن الأداء على البيانات خارج مجموعة التدريب.
- استخدم معايير واضحة لقياس مدى تعقيد أمثلة التدريب وأشجار القرار.
العملية المحددة للتقليم هي: طرح بعض الأشجار الفرعية أو عقد الأوراق من شجرة القرار، ثم استخدام العقدة الجذرية أو العقدة الأصلية كعقدة أوراق.
تصنيف التقليم
يتم تقسيم التقليم عادة إلى فئتين: التقليم المسبق والتقليم اللاحق