HyperAI

عرض توضيحي لتقييم جماليات الصوت من AudioBox-Aesthetics

1. مقدمة البرنامج التعليمي

نجوم جيثب

Audiobox-Aesthetics هي أداة لتقييم جودة الصوت أصدرتها Meta AI (Facebook Research) في 7 فبراير 2025. استنادًا إلى تقنية التعلم العميق، تحقق الأداة تحليلًا تلقائيًا متعدد الأبعاد للكلام والموسيقى والأصوات البيئية، وتقيم جودة الصوت بشكل شامل من خلال أربعة أبعاد أساسية، وتوفر تحليلًا كميًا على المستوى المهني لمنشئي الصوت والمهندسين والباحثين.جماليات ميتا أوديوبوكس: تقييم جودة تلقائي موحد للكلام والموسيقى والصوت".

يستخدم هذا البرنامج التعليمي الموارد لبطاقة RTX 4090 واحدة.

2. أمثلة على التأثيرات

أبعاد التقييميوضح
جودة الإنتاج (PQ)التركيز على الجوانب التقنية للجودة بدلاً من الجودة الذاتية، بما في ذلك وضوح الصوت، والدقة، والنطاق الديناميكي، والتردد، والتوزيع المكاني.
تعقيد الإنتاج (PC)التركيز على تعقيد المشهد الصوتي، والذي يتم قياسه من خلال عدد مكونات الصوت
الاستمتاع بالمحتوى (CE)التركيز على الجودة الذاتية للأعمال الصوتية، وتغطية الأبعاد المفتوحة مثل التأثير العاطفي والمهارات الفنية والتعبير الفني والتجربة الذاتية
فائدة المحتوى (CU)تقييم إمكانية استخدام الصوت كمادة لإنشاء المحتوى من منظور ذاتي

3. خطوات التشغيل

1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة Gradio التفاعلية

2. بمجرد دخولك إلى صفحة الويب، يمكنك استخدام النموذج

إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. نظرًا لأن النموذج كبير الحجم، يرجى الانتظار لمدة 2-3 دقائق وتحديث الصفحة.

احتياطات

  • لضمان الأداء الأمثل، نوصي بتحميل ملفات صوتية بحجم ≤ 10 ميجابايت ومدة ≤ 60 ثانية.
  • قد يتطلب المحتوى الصوتي المعقد، مثل السيمفونيات متعددة الآلات، وقتًا أطول للتقييم.
  • إذا فشل التقييم، تحقق من تنسيق الملف أو حاول اختصار المقطع الصوتي.

معلومات الاستشهاد

معلومات الاستشهاد لهذا المشروع هي كما يلي:

@article{tjandra2025aes,
    title={Meta Audiobox Aesthetics: Unified Automatic Quality Assessment for Speech, Music, and Sound},
    author={Andros Tjandra and Yi-Chiao Wu and Baishan Guo and John Hoffman and Brian Ellis and Apoorv Vyas and Bowen Shi and Sanyuan Chen and Matt Le and Nick Zacharov and Carleigh Wood and Ann Lee and Wei-Ning Hsu},
    year={2025},
    url={https://arxiv.org/abs/2502.05139}
}