الوقاية من العيوب المحلية في التكميم المتجهي من خلال النقل الأمثل

أظهرت الشبكات الكمية المتجهة (VQNs) أداءً متميزًا في مهام متعددة، إلا أنها عرضة للاضطراب أثناء التدريب، مما يُعقّد عملية التدريب نظرًا لضرورة استخدام تقنيات مثل التهيئة الدقيقة والاندماج النموذجي. في هذه الدراسة، نحدد مشكلة المحطات المحلية كسبب رئيسي لهذا الاضطراب. ولحل هذه المشكلة، نُدمج طريقة النقل الأمثل بدلًا من البحث عن أقرب جار لتحقيق تخصيص أكثر شمولاً على المستوى العالمي. نقدم OptVQ، وهي طريقة جديدة للكمية المتجهة تعتمد على خوارزمية سينكورن لتحسين مشكلة النقل الأمثل، مما يعزز استقرار وفعالية عملية التدريب. ولتقليل تأثير التوزيعات المختلفة للبيانات على خوارزمية سينكورن، نُطبّق استراتيجية تطبيع بسيطة ولكنها فعّالة. تُظهر تجاربنا الشاملة على مهام إعادة بناء الصور أن OptVQ تحقق استخدامًا بنسبة 100% لقائمة الرموز (codebook)، وتفوق أحدث النماذج المتطورة من الشبكات الكمية المتجهة من حيث جودة إعادة البناء.