التحديث الخفيف للملحقات في الترجمة الصوتية متعددة اللغات

تم مؤخرًا تقديم وحدات التكييف (Adapter modules) كبديل فعّال لعملية التخصيص الدقيق (fine-tuning) في معالجة اللغة الطبيعية. يتكوّن التكييف باستخدام الوحدات (Adapter tuning) من تثبيت المعاملات المُدرّبة مسبقًا للنموذج، مع إدخال وحدات خفيفة الوزن بين الطبقات، مما يؤدي إلى إضافة عدد قليل جدًا من المعاملات القابلة للتدريب المخصصة للمهمة. وعلى الرغم من أن التكييف باستخدام الوحدات قد تم دراسته في مجال الترجمة الآلية العصبية متعددة اللغات، فإن هذه الورقة تقدّم تحليلًا شاملاً لاستخدام الوحدات في مجال الترجمة الصوتية متعددة اللغات (ST). ونبدأ من نماذج مُدرّبة مسبقًا مختلفة (نموذج ترجمة صوتية متعددة اللغات تم تدريبه على بيانات متوازية، أو نموذج BART متعدد اللغات (mBART) الذي تم تدريبه على بيانات متعددة اللغات غير متوازية)، ونُظهر أن الوحدات يمكن استخدامها لتحقيق: (أ) تخصيص فعّال لترجمة الصوت لزوج معين من اللغات بتكاليف إضافية منخفضة جدًا من حيث عدد المعاملات، و(ب) نقل المعرفة من مهمة التعرف على الكلام التلقائي (ASR) ونموذج mBART المُدرّب مسبقًا إلى مهمة الترجمة الصوتية متعددة اللغات. وتُظهر التجارب أن التكييف باستخدام الوحدات يُقدّم نتائج تنافسية مع التخصيص الدقيق الكامل، مع كونه أكثر كفاءةً من حيث عدد المعاملات بشكل كبير.