HyperAI

الإفراط في أخذ العينات

الإفراط في أخذ العيناتيعني ذلك زيادة أوقات أخذ العينات لنوع معين من الأمثلة في مجموعة التدريب لتقليل اختلال التوازن في الفئة.

الطريقة المقابلة هي تقليل العينة، مما يعني تقليل عدد مرات أخذ العينات لنوع معين من الأمثلة في مجموعة التدريب.

أخذ العينات الزائدة مقابل أخذ العينات الناقصة

يؤدي الإفراط في أخذ العينات إلى نسخ أمثلة الأقلية بشكل عشوائي لزيادة حجمها. يؤدي نقص العينة إلى أخذ عينات عشوائية أقل من الفئة المهيمنة.

وتكمن فائدة الإفراط في أخذ العينات في أنها تؤدي أيضًا إلى تكرار مقدار الخطأ. وعلى العكس من ذلك، فإن نقص العينة قد يجعل تباين المتغيرات المستقلة يبدو أعلى من تباينها الفعلي.

الإفراط في أخذ العينات واختلال التوازن الطبقي

يشير عدم التوازن في الفئات إلى التوزيع غير المتساوي للفئات في مجموعة التدريب المستخدمة لتدريب المصنف. على سبيل المثال، بالنسبة لمشكلة التصنيف الثنائي، هناك 1000 عينة تدريب. من الناحية المثالية، ينبغي أن يكون عدد العينات الإيجابية والسلبية متشابهًا. ومع ذلك، إذا كان هناك 995 عينة إيجابية و5 عينات سلبية فقط، فهذا يعني أن هناك خلل في التوازن الطبقي.

سيؤدي عدم التوازن بين الفئات إلى عدم قدرة النموذج على تعلم كيفية التمييز بين عدد قليل من الفئات، مما سيؤدي إلى انحرافات في الحكم.

يمكن حل اختلال التوازن الطبقي عن طريق أخذ عينات زائدة أو ناقصة وتعديل قيمة θ. يتم استخدام الإفراط في أخذ العينات ونقص أخذ العينات لإنشاء طرق أخذ عينات مناسبة وفقًا لعدد العينات في مجموعة التدريب، مما يؤدي في النهاية إلى تخفيف اختلال التوازن في الفئات.

الكلمة الأصلية: أخذ العينات
المرادفات؛ نقص أخذ العينات