التمثيل التكافؤي للرسم البياني للجيران الأقرب الهرمي لتقليل الأبعاد بكفاءة

يُعد التقليل من الأبعاد أمرًا بالغ الأهمية لكل من التصور والتحضير للبيانات عالية الأبعاد لتعلم الآلة. نقدم طريقة جديدة تعتمد على هرمية مبنية على رسوم بيانية 1-أقرب جار في الفضاء الأصلي، والتي تُستخدم للحفاظ على خصائص الت regrouping في توزيع البيانات على مستويات متعددة. تكمن النواة الأساسية في هذه المقترح في عملية تصوير خالية من التحسين، والتي تتفوق في الأداء ونوعية التصور مقارنة بأحدث إصدارات t-SNE وUMAP، مع سرعة تشغيل تفوقها بمرتبة واحدة على الأقل. علاوةً على ذلك، فإن ميكانيكيات التصوير القابلة للتفسير، وقابلية التصوير للبيانات الجديدة، والانفصال الطبيعي بين مجموعات البيانات في التصورات، تجعلها تقنية عامة للتخفيض غير المراقب للأبعاد. في الورقة البحثية، نناقش صحة المنهجية المقترحة ونُقيّمها على مجموعة متنوعة من مجموعات البيانات، تتراوح أحجامها بين 1000 و11 مليون عينة، وأبعادها بين 28 و16 ألف. ونُجري مقارنات مع طرق حديثة أخرى على عدة مقاييس وأبعاد مستهدفة، مما يبرز كفاءتها وأداؤها المتميز. يمكن الوصول إلى الشيفرة المصدرية عبر الرابط: https://github.com/koulakis/h-nne