HyperAIHyperAI
منذ 2 أشهر

جيت: التجميع استنادًا إلى رسم بياني للطوبولوجيا الشدة

Zhangyang Gao; Haitao Lin; Cheng Tan; Lirong Wu; Stan. Z Li
جيت: التجميع استنادًا إلى رسم بياني للطوبولوجيا الشدة
الملخص

الدقة، والمتانة تجاه الضوضاء والمقياس، والتفسيرية، والسرعة، وسهولة الاستخدام (ARISE) هي متطلبات أساسية لخوارزمية تجميع جيدة. ومع ذلك، فإن تحقيق هذه الأهداف بشكل متزامن يمثل تحديًا، وتركز معظم النهج المتقدمة فقط على جزء منها. في إطار النظر الشامل لهذه الجوانب، نقترح خوارزمية تجميع جديدة تُسمى GIT (التجميع استنادًا إلى \textbf{G}راف \textbf{I}نتENSITY \textbf{T}وبولوجيا). تعتبر خوارزمية GIT الهياكل البيانات المحلية والعالمية معًا: أولاً، تقوم بتشكيل التجمعات المحلية بناءً على قمم الكثافة للعينات، ثم تقدير الرسم البياني التوپولوجي العالمي (التوپو-جراف) بين هذه التجمعات المحلية. نستخدم المسافة ال瓦瑟斯坦 (Wasserstein Distance) بين النسب الفئوية المتنبأ بها والنسب الفئوية الأولية لقطع الحواف الضوضائية تلقائيًا في الرسم البياني التوپولوجي ودمج التجمعات المحلية المتصلة كتجمعات نهائية. بعد ذلك، نقارن بين خوارزمية GIT وسبع خوارزميات منافسة على خمس مجموعات بيانات مصنعة وتسع مجموعات بيانات حقيقية. بفضل اكتشاف سريع للتجمعات المحلية، وبناء راسخ للرسم البياني التوپولوجي، وقطع دقيق للحواف، تظهر خوارزمية GIT أداءً جذابًا في ARISE وتتفوق بشكل كبير على طرق التجميع غير المحدبة الأخرى. على سبيل المثال، تتفوق خوارزمية GIT بنسبة حوالي 10٪ (F1-score) على MNIST وFashionMNIST. يمكن الحصول على الكود من \color{red}{https://github.com/gaozhangyang/GIT}.注:在阿拉伯语中,“瓦瑟斯坦”通常会直接使用英文“Wasserstein”,因此这里保留了英文。

جيت: التجميع استنادًا إلى رسم بياني للطوبولوجيا الشدة | أحدث الأوراق البحثية | HyperAI