اختيار الميزات القائمة على الانحناء مع تطبيق في تصنيف السجلات الصحية الإلكترونية

توفّر التقنيات المُعكِّرة فرصًا فريدة للمساهمة في تحديد العديد من الجوانب في الرعاية الصحية الشاملة، بدءًا من تبني إنترنت الأشياء وصولاً إلى تقنيات التعلم الآلي (ML). كأداة قوية، تم تطبيق التعلم الآلي على نطاق واسع في حلول الرعاية الصحية المتمحورة حول المرضى. لتحسين جودة الرعاية الصحية للمريض بشكل أكبر، يتم استخدام السجلات الصحية الإلكترونية (EHRs) بشكل شائع في مرافق الرعاية الصحية للتحليل. يعتبر تطبيق الذكاء الاصطناعي والتعلم الآلي لتحليل هذه السجلات الصحية الإلكترونية مهمة حاسمة للتنبؤ والتشخيص بسبب طبيعتها غير المنظمة وغير المتوازنة والنقص فيها وإبعادها العالي البُعد. خفض البُعد هو تقنية معالجة بيانات شائعة للتغلب على البيانات عالية البُعد في السجلات الصحية الإلكترونية، والتي تهدف إلى تقليل عدد الخصائص في تمثيل السجل الصحي الإلكتروني مع تحسين أداء التحليل اللاحق للبيانات، مثل التصنيف. في هذا العمل، يتم تقديم طريقة اختيار خصائص فلترية فعالة، وهي اختيار الخصائص القائم على الانحناء (CFS). يطبق CFS المقترح مفهوم الانحناء المينجر لترتيب أوزان جميع الخصائص في مجموعة البيانات المعطاة. تم تقييم أداء CFS المقترح في أربع مجموعات بيانات مشهورة للسجلات الصحية الإلكترونية، بما في ذلك عوامل الخطورة لسرطان عنق الرحم (CCRFDS)، سرطان الثدي كويمبرا (BCCDS)، نسيج الثدي (BTDS)، واعتلال الشبكية السكري دبرشن (DRDDS). تظهر النتائج التجريبية أن CFS المقترح حقق أداءً رائدًا在这四个数据集上,优于传统的主成分分析(PCA)和其他最新的方法。所提出的方法的源代码可在 https://github.com/zhemingzuo/CFS 公开获取。为了确保译文完全符合阿拉伯语的表达习惯,我将对最后一句进行调整:تظهر النتائج التجريبية أن CFS المقترح حقق أداءً رائدًا في هذه المجموعات الأربع من البيانات مقارنة بالطرق التقليدية مثل التحليل الكمي الرئيسي (PCA) وغيرها من الأساليب الحديثة. يمكن الحصول على شفرة المصدر للمقاربة المقترحة بشكل عام من الرابط: https://github.com/zhemingzuo/CFS.