دقة
دقةهو مقياس يستخدم في استرجاع المعلومات والتصنيف الإحصائي، ويشير إلى نسبة العينات الصحيحة المستخرجة إلى عدد العينات المستخرجة. هناك مفهوم مماثل وهو التذكير، والذي يشير إلى نسبة عدد العينات المستخرجة إلى العدد الإجمالي للعينات.
الفرق بين المفهومين (دقة مصفوفة الارتباك)
وتسمى أيضًا نتائج التصنيف الثنائي الأربعة بمصفوفة الارتباك، كما هو موضح في الشكل التالي:
الفئة الحقيقية | التوقع إيجابي | التنبؤ سلبي |
مثال إيجابي | TP (مثال حقيقي) | FP (مثال مضاد خاطئ) |
مثال مضاد | FN (إيجابية خاطئة) | TN (مثال مضاد صحيح) |
هناك العديد من المقاييس المتعلقة بالنتائج المذكورة أعلاه:
الدقة P = TP / (TP + FP) احتمال أن تكون العينة المتوقعة 1 هي 1 بالفعل
تذكر R = TP / (TP + FN) احتمال التنبؤ بقيمة 1 في عينة تساوي 1 فعليًا
عندما تكون القيمتان بين 0 و1، كلما اقتربت القيمة من 1، زادت الاستدعاء أو الدقة.
العلاقة بين المفهومين
غالبًا ما يتم استخدام الدقة والتذكير للحكم على مؤشرات أداء التعلم الآلي. هناك نوعان رئيسيان: منحنى P-R ومقياس F1:
منحنى P-R:المنحنى الذي تم الحصول عليه بدقة واستدعاء كمحور X ومحور Y على التوالي؛
مقياس F1:المتوسط التوافقي للدقة والاسترجاع، والذي يتم تعريفه على أنه 1 / F 1 = 1 / 2 * (1 / P + 1 / R).