تقييم خوارزميات الكشف عن الشذوذ في الوقت الفعلي - معيار نومينتا للكشف عن الشذوذ

جزء كبير من بيانات العالم هي بيانات متدفقة، وهي بيانات سلسلة زمنية، حيث تقدم الشذوذ معلومات ذات أهمية كبيرة في المواقف الحرجة؛ فهناك أمثلة كثيرة في مجالات مثل المالية، وتكنولوجيا المعلومات، والأمن، والطب، والطاقة. ومع ذلك، فإن اكتشاف الشذوذ في البيانات المتدفقة هو مهمة صعبة تتطلب من الكاشفات معالجة البيانات بشكل فوري وليس بالدُفعات، بالإضافة إلى التعلم أثناء إجراء التنبؤات بشكل متزامن. لا توجد مقاييس كافية لاختبار وتقدير فعالية الكاشفات الفورية للشذوذ. هنا نقترح مقاييس الشذوذ لنومينتا (NAB)، والتي تحاول توفير بيئة مراقبة وقابلة للتكرار باستخدام أدوات مفتوحة المصدر لاختبار وقياس خوارزميات اكتشاف الشذوذ على البيانات المتدفقة. الكاشف المثالي سيكتشف جميع الشذوذ بأسرع وقت ممكن، ولن يثير أي إنذارات خاطئة، وسيعمل مع بيانات السلسلة الزمنية الحقيقية في مجموعة متنوعة من المجالات، وسيتكيف تلقائيًا مع الإحصاءات المتغيرة. يتم تقنين تعزيز هذه الخصائص في NAB باستخدام خوارزمية التقييم المصممة للبيانات المتدفقة. يقوم NAB بتقييم الكاشفات على مجموعة بيانات مقاييس تحتوي على بيانات سلسلة زمنية حقيقية ومصنفة. نقدم هذه المكونات ونقدم نتائج وتحليلات لعدة خوارزميات مفتوحة المصدر مستخدمة تجارياً. الهدف من NAB هو تقديم إطار عمل قياسي ومصدر مفتوح يمكن للمجتمع البحثي استخدامه للمقارنة وتقييم مختلف الخوارزميات لاكتشاف الشذوذ في البيانات المتدفقة.