Voice2Series: إعادة برمجة النماذج الصوتية لتصنيف السلاسل الزمنية

تعلُّم تصنيف السلاسل الزمنية باستخدام كميات محدودة من البيانات يُعد مشكلة عملية ولكنها صعبة. تعتمد الطرق الحالية بشكل رئيسي على قواعد استخراج الميزات المصممة يدويًا أو على تكبير البيانات المخصصة للمجالات. مستوحاة من التطورات في نماذج معالجة الصوت العميقة، وبما أن بيانات الصوت تمثل إشارات زمنية أحادية المتغير، نقترح في هذا البحث منهجًا جديدًا من نوع "النظام المتكامل" يُسمى Voice2Series (V2S)، والذي يُعاد برمجته لتصنيف السلاسل الزمنية من خلال تعلُّم تحويل المدخلات وربط العلامات في المخرجات. وباستغلال قدرة النموذج الكبير المُدرَّب مسبقًا في معالجة الصوت على تعلم التمثيل، نُظهر في 30 مهمة مختلفة لتصنيف السلاسل الزمنية أن V2S يحقق نتائج تنافسية في 19 مهمة من هذه المهام. كما نقدّم تبريرًا نظريًا لـ V2S من خلال إثبات أن المخاطر السكانية له محدودة من الأعلى بالمخاطر المصدرية ومسافة واسيرستاين التي تأخذ بعين الاعتبار تطابق الميزات عبر عملية إعادة البرمجة. تُقدّم نتائجنا وسائل جديدة وفعّالة لتصنيف السلاسل الزمنية.