BTS: جسر بين النص والصوت لتصنيف الأصوات التنفسية بمساعدة البيانات الوصفية

تصنيف الأصوات التنفسية (RSC) يعد تحديًا بسبب التوقيعات الصوتية المتباينة، والتي تتأثر بشكل رئيسي بخصائص المرضى الديموغرافية وبيئة التسجيل. لمعالجة هذه المشكلة، نقدم نموذجًا متعدد الوسائط يجمع بين النص والصوت يستخدم بيانات الوصف المرتبطة بالأصوات التنفسية، مما يوفر معلومات مكملة مفيدة لتصنيف الأصوات التنفسية (RSC). تحديدًا، قمنا بضبط نموذج متعدد الوسائط مُدرب مسبقًا باستخدام وصفات نصية حرة مستخلصة من بيانات الوصف للأصوات، والتي تشمل جنس وعمر المرضى، نوع أجهزة التسجيل، وموقع التسجيل على جسم المريض. حققت طريقتنا أداءً عاليًا على مجموعة بيانات ICBHI، حيث تجاوزت أفضل النتائج السابقة بنسبة ملحوظة بلغت 1.17%. هذا النتيجة تؤكد فعالية استخدام بيانات الوصف والأصوات التنفسية في تعزيز أداء تصنيف الأصوات التنفسية (RSC). بالإضافة إلى ذلك، قمنا بدراسة أداء النموذج في الحالات التي تكون فيها بيانات الوصف غير متاحة جزئيًا، وهو ما قد يحدث في الإعداد السريري الحقيقي.