HyperAIHyperAI
منذ 17 أيام

تجاهل المستوى الإطاري: التحويل الموسيقي للبيانو القائم على الحدث باستخدام نماذج نصف-الـ CRF العصبية

{Zhiyao Duan, Frank Cwitkowitz, Yujia Yan}
تجاهل المستوى الإطاري: التحويل الموسيقي للبيانو القائم على الحدث باستخدام نماذج نصف-الـ CRF العصبية
الملخص

تُعد أنظمة تحويل البيانو عادةً مُحسَّنة لتقدير نشاط النغمة في كل إطار من أطر الصوت. وغالبًا ما تُتبع هذه الأنظمة بخوارزميات تفكيرية مصممة بدقة ومعالجة ما بعدية لتقدير أحداث النغمة من التقديرات على مستوى الإطارات. كما تم في الطرق الحديثة صياغة تحويل البيانو كمشكلة تعلم متعددة المهام، حيث يتم تقدير نشاط مراحل مختلفة من حدث نغمة بشكل مستقل. إلا أن هذه الممارسات لا تتماشى جيدًا مع النتيجة المرجوة من المهمة، وهي تحديد فترات النغمة كأحداث متكاملة، بدلًا من تجميع ملاحظات منفصلة. في هذا العمل، نقترح صيغة جديدة لتحويل البيانو، مُحسَّنة لتوقع أحداث النغمة مباشرةً. تعتمد طريقةنا على نماذج الحقول العشوائية الشرطية شبه ماركوف (semi-CRF)، التي تُنتج نقاطًا للفترات بدلًا من الإطارات الفردية. وبصياغة تحويل البيانو بهذه الطريقة، نزيل الحاجة إلى الاعتماد على تقديرات منفصلة على مستوى الإطارات لمراتب مختلفة من حدث نغمة. ونُجري تجارب على مجموعة بيانات MAESTRO، ونُظهر أن النموذج المقترح يتفوق على الحالة الراهنة في مجال تحويل البيانو. تشير نتائجنا إلى أن طبقة الإخراج بنموذج semi-CRF، رغم بقائها ذات تعقيد تربيعي، تُعد حلًا بسيطًا وسريعًا وذو أداء عالٍ في التنبؤ القائم على الأحداث، وقد يُسهم في نجاح مشابه في مجالات أخرى تعتمد حاليًا على التقديرات على مستوى الإطارات.

تجاهل المستوى الإطاري: التحويل الموسيقي للبيانو القائم على الحدث باستخدام نماذج نصف-الـ CRF العصبية | أحدث الأوراق البحثية | HyperAI