بايز الساذجهي خوارزمية تصنيف تعتمد على نظرية الاحتمالات. وفقًا للصيغة البايزية، فإنه من الممكن التنبؤ باحتمالية حدوث كل فئة وتصنيفها. الحل هو تصنيف العناصر التي يجب تصنيفها إلى الفئة ذات احتمال حدوث جميع الميزات وفقًا لاحتمال حدوث كل ميزة في الفئة.
خصائص بايزية ساذجة
الشرط الأساسي لاستخدام بايز الساذج هو أن تكون الميزات التي يجب تصنيفها مهمة بنفس القدر ولا ترتبط ببعضها البعض.
ميزة:
- كفاءة عالية في التعلم والتنبؤ، وكفاءة تصنيف مستقرة وسهولة التنفيذ؛
- لا يزال فعالاً عندما تكون البيانات أقل ويمكنه التعامل مع مشكلات التصنيف المتعددة؛
- طالما أن حالة استقلال المتغير قائمة، فإن المصنف بايز الساذج يعمل بشكل أفضل؛
- فهو يحتوي على أقل معدل خطأ مقارنة بطرق التصنيف الأخرى.
عيب:
- تأثير التصنيف ليس جيدًا بشكل خاص؛
- إن افتراض استقلال الميزة يجعل خوارزمية بايز الساذجة أبسط، ولكنها ستضحي بدرجة معينة من دقة التصنيف؛
- وفي الممارسة العملية، من الصعب تلبية افتراض الظروف المستقلة؛
- إذا لم تتم ملاحظة فئات المتغير التصنيفي دائمًا في مجموعة بيانات التدريب، فلن يكون من الممكن إجراء أي تنبؤ.
سيناريوهات وممارسات التطبيق
هناك عادة طريقتان لتنفيذ Naive Bayes: تعتمد على نموذج Bernoulli وتعتمد على نموذج متعدد الحدود.
التطبيقات الرئيسية لـ Naive Bayes هي:
- التنبؤ في الوقت الحقيقي
- التنبؤ متعدد الفئات
- تصنيف النصوص / تصفية البريد العشوائي / تحليل المشاعر
- نظام التوصية
فكرة بايز الساذجة
ما تفعله طريقة بايز الساذجة هو حساب الفئة التي ينتمي إليها y x. تتم العملية على النحو التالي:
- ليكن
عنصرًا يجب تصنيفه، وكل
هو سمة مميزة لـ
؛ - الفئات التي سيتم تصنيفها هي المجموعة
؛ - احسب احتمال أن ينتمي
إلى
: $latex {P{ \left( {y\mathop{{}}\nolimits_{{{1}} \left| x\right. } \right) },\text{ }P{ \left( {y\mathop{{}}\nolimits_{{{2}} \left| x\right. } \right) },\text{ }…,\text{ }P{ \left( {y\mathop{{}}\nolimits_{{{n}} \left| - إذا تم تصنيف
.
كلمات ذات صلة: مصنف بايز الساذج