AUCO ResNet: شبكة نهائية إلى النهاية للفحص الأولي لفيروس كورونا من خلال السعال والتنفس
تُقدّم هذه الدراسة شبكة AUCO ResNet العصبية العميقة المستوحاة من الطبيعة، وهي مصممة خصيصًا لتصنيف الصوت، وبشكل خاص للكشف عن فيروس كوفيد-19 من خلال تسجيلات الصوت الخاصة بالسعال والتنفس. على عكس النهج الأخرى، يمكن تدريب هذه الشبكة بالكامل من البداية إلى النهاية (end-to-end)، مما يسمح بتحسين جميع مكونات خوارزمية التعلّم باستخدام التدرج الهابط (gradient descent)، بما في ذلك تصميم مرشحات ميل-مشابهة (mel-like filter design)، واستخراج الميزات، واختيار الميزات، وتقليل الأبعاد، والتنبؤ. تحتوي الشبكة على ثلاث آليات انتباه، تشمل آلية التضييق والتحفيز (squeeze and excitation)، ووحدة انتباه الكتلة التلافيفية (convolutional block attention module)، بالإضافة إلى آلية انتباه جديدة قابلة للتعلّم باستخدام الدوال الجيبية (sinusoidal learnable attention). تُمكّن آلية الانتباه من دمج المعلومات ذات الصلة من خرائط التنشيط على مستويات مختلفة من الشبكة. تأخذ الشبكة كمدخلات ملفات الصوت الخام، ويمكنها أيضًا تعديل مراحل استخراج الميزات بشكل دقيق (fine-tune). ففي الواقع، يتم تصميم مرشح ميل-مشابه أثناء التدريب، مما يسمح بتكييف حزم المرشحات على الترددات المهمة. وقد أثبتت AUCO ResNet نتائج متميزة على العديد من مجموعات البيانات. في البداية، تم اختبارها على عدة مجموعات بيانات تحتوي على تسجيلات سعال وتنفس لمرضى كوفيد-19. ويرجع هذا الاختيار إلى أن السعال والتنفس لا يعتمدان على اللغة، ما يمكّن من إجراء اختبارات متعددة بين مجموعات البيانات بهدف التعميم. وقد أظهرت هذه الاختبارات أن النهج يمكن اعتماده كأداة مُبكرة للكشف عن كوفيد-19 بتكاليف منخفضة، وسريعة، وقابلة للتطبيق عن بعد. كما تم اختبار الشبكة على مجموعة UrbanSound 8K الشهيرة، حيث حققت دقة متميزة دون الحاجة إلى أي معالجة مسبقة للبيانات أو استخدام تقنيات تضخيم البيانات (data augmentation).