HyperAIHyperAI
منذ 9 أيام

MIX: إطار تعلم مشترك للكشف عن الانحرافات المجمعة والمنفصلة في البيانات المختلطة النوع

{Zhiyue Wu, Yongjun Wang, Yijie Wang, Hongzuo Xu}
الملخص

تُعد البيانات من النوع المختلط شائعة جدًا في الحياة الواقعية، لكن عدد الطرق المتاحة للكشف عن القيم الشاذة فيها محدود جدًا. تعتمد بعض الطرق الحالية على تحويل الخصائص لمعالجة البيانات المختلطة، لكن أداءها يتأثر سلبًا بفقدان المعلومات والضوضاء الناتجة عن هذه التحولات. أما النهج الآخر فيقيّم شاذية البيانات بشكل منفصل في الفضاءات العددية والتصنيفية، لكنه يفشل في أخذ سلوك الكائنات البيانات في الفضاءات المختلفة بعين الاعتبار بشكل كافٍ، مما يؤدي غالبًا إلى نتائج غير مثلى. وبالنسبة لشكل القيم الشاذة، فإن العديد من البيانات الواقعية تحتوي على كل من القيم الشاذة المجمعة والمنتشرة، لكن العديد من أدوات الكشف عن القيم الشاذة محدودة بشكل جوهري بتعريفاتها الخاصة، ما يمنعها من اكتشاف كلا النوعين معًا. ولحل هذه المشكلات، نقترح طريقة غير مُراقبة للكشف عن القيم الشاذة تُسمى MIX. تُنشئ MIX إطارًا تعلمًا مشتركًا لبناء آلية تعاونية تُمكّن من التبادل المستمر بين تقييمات الشاذية في الفضاءات المختلفة، وتمكّن من فهم شامل لسلوك الكائنات البيانات في الفضاء الآخر. بشكل محدد، تقوم MIX بتقييم الشاذية بشكل تكراري في الفضاءات العددية والتصنيفية، حيث يمكن لكل مرحلة من مراحل التقييم تحسين نفسها بشكل تكراري وتعاوني من خلال المعرفة السابقة التي توفرها الفضاء الآخر. ولتغطية كلا النوعين من القيم الشاذة (المجمعة والمنتشرة)، تلتقط مراحل التقييم خاصية أساسية للقيم الشاذة، وهي تقييم الشاذية من خلال الانحراف عن النموذج الطبيعي. ونُظهر أن MIX تتفوق بشكل كبير على ثمانية من أحدث الطرق المُتقدمة للكشف عن القيم الشاذة على اثني عشر مجموعة بيانات واقعية، كما تُظهر أداءً جيدًا من حيث القابلية للتوسع.