HyperAIHyperAI
منذ 15 أيام

ARSC-Net: شبكة تصنيف الأصوات التنفسية العرضية باستخدام مسارات متوازية مع انتباه قنواتي-مكاني

{Jianxin Wang, Fan Wu, Hulin Kuang, Jin Liu, Jianhong Cheng, Lei Xu}
الملخص

لا تزال التعرف التلقائي على الأصوات التنفسية غير الطبيعية مشكلة صعبة في السنوات الأخيرة. ولحل هذه التحديات، نقترح شبكة تصنيف الأصوات التنفسية غير الطبيعية (ARSC-Net)، التي تدمج بين الكتلة المتبقية (Residual Block) والانتباه القناتي-المكاني (Channel-Spatial Attention) لتحقيق تصنيف دقيق. بشكل خاص، نستخرج نوعين من السمات من الأصوات التنفسية غير الطبيعية، وهما معاملات كوسيل كوسيل التردد الميل (Mel-Frequency Cepstral Coefficients - MFCCs) والمل-سبكتروغرام (Mel-spectrogram). تُدخل هاتان النوعان من السمات إلى مسارين متوازيين للترميز (Encoders) مزودين بانتباه متبقٍ، بهدف استخلاص تمثيلات السمات، ثم تُدمج هذه التمثيلات في وحدة انتباه قناتي-مكاني لتركيز تلقائي على السمات المهمة بين الأجزاء القناتية والمكانيّة في مهمة التصنيف. علاوة على ذلك، يمكن لوحدة الانتباه القناتي-المكاني تعزيز تمثيلات السمات، حيث تقوم الانتباه القناتي بتحليل العلاقات بين القنوات في الطيف، ثم يتم إنشاء خريطة الارتباط المكاني الداخلي من خلال الانتباه المكاني الذي يُطبَّق تسلسليًا. قمنا بتقييم الطريقة المقترحة على قاعدة بيانات ICBHI 2017. أظهرت النتائج التجريبية أن الطريقة المقترحة تحقق أداءً تنبؤيًا مرضيًا، حيث بلغت دقة التمييز بين الأصوات الطبيعية وغير الطبيعية 80.0%، وبلغت دقة التمييز بين الأصوات المُرَقَّعة (Crackles) والأصوات الصفيرية (Wheezes) 92.4%. بالإضافة إلى ذلك، حققت الطريقة درجة قدرها 56.76% في تصنيف الأصوات غير الطبيعية إلى أربع فئات، وتفوقت على عدة طرق حديثة متطورة في هذا المجال.

ARSC-Net: شبكة تصنيف الأصوات التنفسية العرضية باستخدام مسارات متوازية مع انتباه قنواتي-مكاني | أحدث الأوراق البحثية | HyperAI