Vibravox: مجموعة بيانات للكلام الفرنسي ملتقطة باستخدام أجهزة استشعار الصوت عبر التوصيل الجسدي

فيبرافوكس هو مجموعة بيانات متوافقة مع لائحة حماية البيانات العامة (GDPR) تحتوي على تسجيلات صوتية باستخدام خمسة أجهزة استشعار صوتية تعمل بالنقل عبر الجسم: ميكروفونان داخل الأذن، ومكثفان للاهتزاز يعملان بنقل الصوت عبر العظام، ومرسل حنكي. تشمل المجموعة أيضًا بيانات صوتية من ميكروفون جوي يستخدم كمرجع. يحتوي سجل فيبرافوكس على 38 ساعة من عينات الكلام والأصوات الفسيولوجية المسجلة بواسطة 188 مشاركًا تحت ظروف صوتية مختلفة فُرضت بواسطة مكثف فضائي ثلاثي الأبعاد من الرتبة العليا. كما تضم المجموعة بيانات حول ظروف التسجيل والتحويلات اللغوية. قمنا بإجراء سلسلة من التجارب على مهام متعددة مرتبطة بالكلام، بما في ذلك التعرف على الكلام، وتحسين جودة الصوت، وتحقق هوية المتحدث. تم إجراء هذه التجارب باستخدام نماذج حديثة لتقدير ومقارنة أدائها على الإشارات التي تم التقاطها بواسطة أجهزة الاستشعار الصوتية المختلفة التي توفرها مجموعة بيانات فيبرافوكس، وذلك بهدف فهم أفضل لخصائص كل منها.