HyperAI

افتراض الاستقلال الشرطي للسمة

يتبنى مصنف بايز الساذج "افتراض الاستقلال الشرطي للسمة": بالنسبة للفئات المعروفة، يُفترض أن جميع السمات مستقلة عن بعضها البعض.

تحسينات على بايز الساذج:

  1. من أجل منع "محو" المعلومات التي تحملها السمات الأخرى بواسطة قيم السمات التي لم تظهر أبدًا في مجموعة التدريب، يتم عادةً إجراء "التنعيم" عند تقدير قيم الاحتمالية، وغالبًا ما يتم استخدام "تصحيح لابلاس"؛
  2. تم تخفيف افتراض الاستقلال الشرطي للصفة إلى حد ما؛
  3. تتميز علاقة التبعية بين السمات باستخدام الرسوم البيانية غير الدورية الموجهة، ويتم وصف توزيع الاحتمالات المشتركة للسمات باستخدام جداول الاحتمالات الشرطية.

تتمتع مصنفات بايز الساذجة بقدرة عالية على التوسع وبالتالي تتطلب عددًا من المعلمات يكون خطيًا في عدد المتغيرات (الميزات/التنبؤات) في مشكلة التعلم. يمكن إجراء تدريب الاحتمالية القصوى عن طريق تقييم تعبير مغلق الشكل في وقت خطي، بدلاً من طلب التقريب التكراري الذي يستغرق وقتًا طويلاً والذي تستخدمه العديد من الأنواع الأخرى من المصنفات.

في أدبيات الإحصاء وعلوم الكمبيوتر، يُعرف نموذج بايز الساذج بأسماء مختلفة، بما في ذلك بايز البسيط وبايز المستقل. تشير كل هذه الأسماء إلى استخدام نظرية بايز في قاعدة قرار المصنف، ولكن بايز الساذج لا يستخدم (بالضرورة) الأساليب البايزية؛ ويشير راسل ونورفيج إلى أن "نموذج بايز الساذج يُطلق عليه أحيانًا اسم المصنف البايزي، وهو استخدام غير دقيق دفع البايزيين الحقيقيين إلى تسميته بنموذج بايز الغبي".