HyperAIHyperAI
منذ 11 أيام

التجميع الصور المستند إلى تحويل التشتت باستخدام التصوير على المتمم المتعامد

Angel Villar-Corrales, Veniamin I. Morgenshtern
التجميع الصور المستند إلى تحويل التشتت باستخدام التصوير على المتمم المتعامد
الملخص

في السنوات القليلة الماضية، دفع التقدم الأخير في التعلم العميق تحسينات كبيرة في تجميع الصور. ومع ذلك، نظرًا لتعقيد البنية المعمارية للشبكات العصبية العميقة، لا توجد حتى الآن نظرية رياضية تفسر نجاح تقنيات التجميع العميقة. في هذا العمل، نقدّم خوارزمية متميزة ومستقرة وسريعة لتأليف الصور تُدعى "تجميع الطيف المُنقَل المُتَحَوِّل" (PSSC)، والتي تتمتع أيضًا بقابلية تفسير رياضي. تتضمن PSSC طريقة جديدة لاستغلال البنية الهندسية لتحويل التشتت (scattering transform) للصور الصغيرة. وتستمد هذه الطريقة إلهامها من ملاحظة أن الفضاءات الجزئية الناتجة عن متجهات ذاتية تتوافق مع أكبر عدد قليل من القيم الذاتية لمصفوفات البيانات الخاصة بكل فئة، تكون تقريبًا مشتركة بين الفئات المختلفة. وبالتالي، فإن عملية إزالة هذه الفضاءات المشتركة (أي إجراء التمثيل على المكمل المتعامد لها) تقلل بشكل كبير من التباين الداخلي للصفات، مما يعزز أداء التجميع بشكل كبير. نطلق على هذه الطريقة "التمثيل على المكمل المتعامد" (POC). تُظهر تجاربنا أن PSSC تحقق أفضل النتائج بين جميع خوارزميات التجميع السطحية. علاوة على ذلك، تحقق أداءً تجميعًا مماثلًا لأفضل التقنيات الحديثة في هذا المجال، مع تقليل زمن التنفيذ بأكثر من مرتبة واحدة. وفي سياق البحث القابل للتكرار، نُ publiش مستودعًا للشفرة عالية الجودة مع المقالة.

التجميع الصور المستند إلى تحويل التشتت باستخدام التصوير على المتمم المتعامد | أحدث الأوراق البحثية | HyperAI