HyperAI

خوارزمية الغابة العشوائية

غابة عشوائيةإنها خوارزمية متعددة الوظائف تتضمن أشجار قرار متعددة. ويستخدم مجموعة عينات مكونة من عينات الاستبدال لتدريب شجرة القرار. تستخدم كل عقدة من شجرة القرار بعض ميزات أخذ العينات العشوائية فقط أثناء التدريب.

عند تصنيف كائن جديد استنادًا إلى سمة ما، فإن كل شجرة في الغابة العشوائية ستقدم أولاً خيار التصنيف الخاص بها و"تصوت" عليه. بالنسبة لمشاكل التصنيف، سيكون ناتج الغابة هو الناتج الذي يحصل على أكبر عدد من الأصوات؛ بالنسبة لمشاكل الانحدار، سيكون مخرجات الغابة عبارة عن متوسط مخرجات أشجار القرار.

في خوارزمية الغابة العشوائية، "العشوائية" هي الأساس، و"الغابة" هي مجرد طريقة مركبة. عند بناء كل شجرة، تعتمد الغابة عادة على طبقتين أو ثلاث طبقات من العشوائية لضمان استقلال كل شجرة.

ميزات الغابة العشوائية

  • المزايا: دقة عالية للغاية، ليس من السهل الإفراط في التجهيز، مقاومة جيدة للضوضاء، يمكن التعامل مع البيانات عالية الأبعاد دون اختيار الميزة، يمكن التعامل مع البيانات المنفصلة والبيانات المستمرة، لا تحتاج مجموعات البيانات إلى التطبيع، سرعة تدريب سريعة، يمكن الحصول على تصنيف أهمية متغيرة، وسهلة التوازي.
  • العيوب: المعلمات المعقدة، والمساحة الكبيرة والوقت المطلوب للتدريب، وبعض مناطق النموذج لا يمكن تفسيرها.

تطبيق الغابة العشوائية

  • تنفيذ مهام الانحدار والتصنيف؛
  • تُستخدم للتعامل مع القيم المفقودة والقيم المتطرفة والخطوات المهمة الأخرى في استكشاف البيانات؛
  • يتم استخدامه لدمج العديد من النماذج غير الفعالة في نموذج فعال واحد.
الكلمة الأصلية: خوارزمية التعبئة
الكلمات الفرعية: شجرة القرار

مراجع

【1】https://blog.csdn.net/qq547276542/article/details/78304454

【2】https://blog.csdn.net/lishuandao/article/details/52555103

【3】https://en.wikipedia.org/wiki/Random_forest

【4】http://dataunion.org/23602.html