التجميع الطيفي فائق القابلية للتوسع والتجميع الجماعي

يركز هذا البحث على قابلية التوسع والمتانة في تقسيم الطيف (الترقيم الطيفي) للبيانات الضخمة جدًا ذات الموارد المحدودة. تم اقتراح خوارزميتين جديدتين، وهما تقسيم الطيف الفائق القابل للتوسع (U-SPEC) وتقسيم التجميع الفائق القابل للتوسع (U-SENC). في U-SPEC، تم اقتراح استراتيجية هجينة لاختيار النماذج وطريقة تقريب سريعة للنماذج الأقرب كـ K، وذلك لبناء مصفوفة تشابه نادرة. من خلال تفسير هذه المصفوفة النادرة كرسم ثنائي القسم، يتم استخدام القطع الانتقالي لتقسيم الرسم بشكل فعال والحصول على نتيجة التقسيم. أما في U-SENC، فقد تم دمج عدة مصنفات U-SPEC ضمن إطار تجميعي لتعزيز متانة U-SPEC مع الحفاظ على الكفاءة العالية. استنادًا إلى إنشاء التجميع عبر عدة U-SEPC، يتم بناء رسم ثنائي القسم جديد بين الأشياء والمجموعات الأساسية ثم تقسيمه بكفاءة لتحقيق نتيجة التجميع الإجماعية. من الجدير بالذكر أن كلًا من U-SPEC وU-SENC يمتلكان تعقيدًا زمنيًا ومكانيًا شبه خطي، وأنهما قادران على تقسيم بيانات غير خطية قابلة للفصل بحجم عشرات الملايين بشكل متين وكفء على جهاز كمبيوتر به ذاكرة عشوائية بحجم 64 جيجابايت. أظهرت التجارب التي أجريت على مختلف البيانات الضخمة قابلية التوسع والمتانة لخوارزمياتنا. يمكن الحصول على الشفرة البرمجية لماتلاب والبيانات التجريبية من الرابط التالي: https://www.researchgate.net/publication/330760669.