استكشاف التمثيلات الصوتية العامة المدربة مسبقًا للكشف عن صفير القلب

للتقليل من الحاجة إلى الأطباء ذوي الخبرة في تفسير أصوات القلب، استكشفت الدراسات الحديثة حول تلقين الاستماع القلبي آليًا الأساليب المستندة إلى التعلم العميق. ومع ذلك، على الرغم من الحاجة إلى كميات كبيرة من البيانات للتعلم العميق، فإن حجم مجموعات بيانات أصوات القلب محدود ولا يوجد نموذج مُدرب مسبقًا. بالمقابل، هناك العديد من النماذج المُدربة مسبقًا لمهام الصوت العامة المتاحة كتمثيلات صوتية عامة. تهدف هذه الدراسة إلى استكشاف إمكانات التمثيلات الصوتية العامة التي تم تدريبها على مجموعات بيانات واسعة النطاق لنقل التعلم في اكتشاف ضوضاء القلب. أظهرت التجارب على مجموعة بيانات أصوات القلب CirCor DigiScope أن طريقة التعلم الذاتي المُراقب مؤخرًا Masked Modeling Duo (M2D) تتفوق على الطرق السابقة بنتائج دقة وزنية قدرها 0.832 ومتوسط استدعاء غير مرتكز على الوزن قدره 0.713. كما أكدت التجارب زيادة الأداء عند الجمع بين M2D ونماذج أخرى. تُظهر هذه النتائج فعالية التمثيل الصوتي العام في معالجة أصوات القلب وتفتح الطريق لتطبيقات أخرى مستقبلًا. الرمز البرمجي الخاص بنا متاح عبر الإنترنت ويمكن تشغيله على بطاقة رسوميات GPU للمستهلك بحجم 24 جيجابايت في الرابط التالي: https://github.com/nttcslab/m2d/tree/master/app/circor