HyperAIHyperAI
منذ 12 أيام

Spleeter: أداة سريعة ومتقدمة لفصل مصادر الموسيقى مع نماذج مُدرَّبة مسبقًا

{Manuel Moussallam, Romain Hennequin, Felix Voituret, Anis Khlif}
الملخص

نقدّم وأطلق أداة جديدة لفصل مصادر الصوت الموسيقي باستخدام نماذج مُدرّبة مسبقًا تُدعى Spleeter. صُمّمت Spleeter بمراعاة السهولة في الاستخدام والأداء العالي والسرعة. تعتمد Spleeter على إطار Tensorflow [1]، وتتيح إمكانية:• فصل ملفات الصوت إلى 2 أو 4 أو 5 أصوات (Stems) باستخدام أمر سطر أوّلي واحد، باستخدام نماذج مُدرّبة مسبقًا.• تدريب نماذج فصل المصادر أو تحسين النماذج المُدرّبة مسبقًا باستخدام Tensorflow (بشرط توفر مجموعة بيانات مكوّنة من مصادر منفصلة). أداء النماذج المُدرّبة مسبقًا قريب جدًا من الحالة المتطورة المنشورة، ووفقًا للمعرفة لدى المؤلفين، فإنها تمثل أفضل نموذج لفصل الأصوات إلى 4 أصوات مُتاحة للجمهور على معيار musdb18 الشائع [6]. كما أن Spleeter سريعة جدًا، إذ يمكنها فصل ملف صوتي مختلط إلى 4 أصوات بمعدل يتجاوز 100 مرة سرعة الوقت الفعلي (real-time) على وحدة معالجة رسومية واحدة (GPU) باستخدام النموذج المُدرّب مسبقًا لـ 4 أصوات. وتم تضمين Spleeter داخل حاوية Docker، مما يجعلها قابلة للاستخدام مباشرة على منصات متعددة.

Spleeter: أداة سريعة ومتقدمة لفصل مصادر الموسيقى مع نماذج مُدرَّبة مسبقًا | أحدث الأوراق البحثية | HyperAI