التمثيل الشعاعي العميق للتعلم التسلسلي البصري

يُعدّ التصنيف الزمني الاتصالي (Connectionist Temporal Classification - CTC) دالة هدف شائعة في التعرف على التسلسلات، حيث يُوفّر إشرافًا على بيانات التسلسل غير المُقسَّمة من خلال محاذاة التسلسل مع التسمية المقابلة له بشكل تكراري. تلعب فئة الفراغ (blank class) في CTC دورًا محوريًا في عملية المحاذاة، وغالبًا ما تُعتبر مسؤولة عن السلوك "القمّي" (peaky behavior) الخاص بـ CTC. في هذه الدراسة، نقترح دالة هدف تُسمّى RadialCTC، التي تُقيّد ميزات التسلسل على كرة فائقة (hypersphere) مع الحفاظ على آلية المحاذاة التكرارية المميزة لـ CTC. تُوزّع الميزات المُتعلّمة لكل فئة غير فراغية على قوسٍ شعاعي ينطلق من مركز فئة الفراغ، مما يُوفّر تفسيرًا هندسيًا واضحًا ويُحسّن كفاءة عملية المحاذاة. بالإضافة إلى ذلك، يمكن لـ RadialCTC التحكّم في السلوك القمّي من خلال تعديل بسيط في القيمة اللوغاريتمية (logit) لفئة الفراغ فقط. أظهرت النتائج التجريبية الخاصة بالتعرف والتحديد فعالية RadialCTC في تطبيقي التعرف على التسلسلين.