ترددات ميل سيبستروم MFCCs
معاملات التردد الميلانيني (MFCCs) هي تقنية تستخدم على نطاق واسع في مجال معالجة الصوت، وخاصة في التعرف على الكلام والتعرف على المتحدث. تم اقتراحها من قبل ديفيس وميرميلشتاين في عام 1980 وهي تعتمد على التحويل الخطي لطيف القدرة اللوغاريتمي لمقياس ميل غير الخطي لترددات الصوت.
معاملات التردد الميلانيني (MFCCs) هي معاملات تشكل التردد الميلانيني، والتي يتم اشتقاقها من السنبلة في مقطع صوتي ومتباعدة بالتساوي على مقياس ميل في نطاقات تقترب بشكل أفضل من النظام السمعي البشري من النطاقات المتباعدة خطيًا المستخدمة في السنبلة الطبيعية. يمكن أن يؤدي هذا التمثيل غير الخطي إلى تمثيل أفضل لإشارات الصوت في العديد من المجالات، مثل ضغط الصوت. يمكن تقسيم عملية حساب MFCCs تقريبًا إلى الخطوات التالية: قراءة ملف الصوت، والتأكيد المسبق، والتأطير، والنوافذ، وتحويل فورييه، والحصول على طيف Mel من خلال بنك مرشح Mel، وإجراء تحليل cepstrum على طيف Mel. تحتوي MFCCs عادة على 12 معاملًا، يتم فرضها على طاقة الإطار للحصول على معاملات ثلاثية الأبعاد، والتي تستخدم لوصف خصائص كل إطار من الكلام.