استخدام متحول غير هرمي لتصنيف فترات الزمن في الترجمة الآلية للبيانو

أظهر الإطار العصبي شبه ماركوف للحقول العشوائية الشرطية (شبه-CRF) وعودًا في مجال نقل الأداء على البيانو بناءً على الأحداث. في هذا الإطار، يتم تمثيل جميع الأحداث (الألحان أو الدواسات) كفواصل زمنية مغلقة مرتبطة بأنواع أحداث معينة. تتطلب الطريقة العصبية شبه ماركوفية مصفوفة تقييم الفواصل التي تعين درجة لكل فترة مرشحة. ومع ذلك، فإن تصميم هندسة فعالة وواضحة لتقييم الفواصل ليس بالأمر السهل. يقدم هذا البحث طريقة بسيطة لتقييم الفواصل باستخدام عمليات الجداء الداخلي المُقَيَّد، والتي تشبه كيفية تقييم الانتباه في المتحولات (transformers). نوضح نظريًا أن، بسبب الهيكل الخاص من ترميز الفواصل الزمنية غير المتداخلة، تحت ظروف خفيفة، تكون عمليات الجداء الداخلي واضحة بما يكفي لتمثيل مصفوفة التقييم المثالية التي يمكن أن تؤدي إلى نتيجة النقل الصحيحة. ثم نثبت أن جذر المتحولة المنظمة الغير هرمي الذي يعمل فقط على خريطة ميزات ذات دقة زمنية منخفضة هو قادر على نقل ألحان البيانو والدواسات بدقة عالية ودقة زمنية عالية. أظهرت التجربة أن طريقتنا تحقق أفضل الأداء الحالي في جميع المهام الفرعية من حيث قياس F1 على مجموعة بيانات Maestro.