CycleGuardian: إطار عمل للتصنيف التلقائي لصوتيات التنفس بناءً على التجميع العميق المُحسَّن والتعلم التمييزي

تلعب الاستماع الطبي (Auscultation) دورًا محوريًا في التشخيص المبكر للأمراض التنفسية والرئوية. وعلى الرغم من ظهور أساليب قائمة على التعلم العميق لتصنيف الأصوات التنفسية تلقائيًا بعد جائحة كوفيد-19، إلا أن قلة كميات البيانات المتاحة تعيق تحسين الأداء. ويُعد التمييز بين الأصوات التنفسية الطبيعية وغير الطبيعية تحديًا كبيرًا نظرًا لوجود مكونات تنفسية طبيعية وعوامل تشويش في كلا النوعين معًا. علاوةً على ذلك، تُظهر الأصوات التنفسية غير الطبيعية خصائص شاذة مشابهة، مما يُعيق تمييزها عن بعضها البعض. بالإضافة إلى ذلك، تعاني النماذج الرائدة حاليًا من حجم كبير جدًا للبارامترات، ما يعيق تشغيلها على منصات محمولة محدودة الموارد. ولحل هذه التحديات، قمنا بتصميم شبكة خفيفة الوزن تُسمى CycleGuardian، واقترحنا إطارًا يعتمد على تجميع عميق محسّن وتعلم تبايني (contrastive learning). أولاً، نُنشئ طيفًا هجينًا (hybrid spectrogram) لتعزيز تنوع الميزات، ونُجمّع الطيفيات لتسهيل التقاط الأصوات غير الطبيعية المتقطعة. ثم، تقوم CycleGuardian بدمج وحدة تجميع عميق مع مكون تجميع مُحدَّد بالتماثل (similarity-constrained clustering) لتحسين قدرة التقاط الميزات غير الطبيعية، ووحدة تعلم تبايني مع خلط المجموعات (group mixing) لتعزيز التمييز بين الميزات غير الطبيعية. كما يُعزز التحسين متعدد الأهداف الأداء العام أثناء التدريب. في التجارب، استخدمنا مجموعة بيانات ICBHI2017، واتبعنا طريقة التقسيم الرسمية دون استخدام أي أوزان مُدرَّبة مسبقًا، وحققنا أداءً متميزًا بـ Sp: 82.06٪، Se: 44.47٪، وScore: 63.26٪، مع حجم نموذج شبكي قدره 38 ميغابايت، متفوّقًا على النموذج الحالي بنحو 7٪، مما يُحقّق أفضل أداء مُسجّل حتى الآن. علاوةً على ذلك، قمنا بنشر الشبكة على أجهزة أندرويد، مُظهرين نظامًا ذكيًا متكاملًا للاستماع الطبي الصوتي التنفسي.