تحليل مقارن لدمج متعدد الأوميات باستخدام شبكات العصب الرسمية المتقدمة لتصنيف السرطان

تُستخدم بيانات متعددة الأوميكس بشكل متزايد لتطوير طرق حاسوبية لتصنيف السرطان. ومع ذلك، فإن دمج بيانات متعددة الأوميكس يطرح تحديات كبيرة بسبب البُعد العالي للبيانات، وتعقيد البيانات، والخصائص المتميزة لأنواع مختلفة من الأوميكس. تتناول هذه الدراسة هذه التحديات وتقييم ثلاثة هياكل شبكات عصبية بيانية لدمج متعدد الأوميكس (MO) بناءً على شبكات التجميع البيانية (GCN)، وشبكات الانتباه البيانية (GAT)، وشبكات التحويل البيانية (GTN) لتصنيف 31 نوعًا من السرطان والأنسجة الطبيعية. للتعامل مع البُعد العالي لبيانات متعددة الأوميكس، تم استخدام الانحدار LASSO (أقل انكماش مطلق واختيار مشغل) لاختيار الخصائص، مما أدى إلى إنشاء نماذج LASSO-MOGCN، LASSO-MOGAT، وLASSO-MOTGN. تم بناء الهياكل البيانية للشبكات باستخدام مصفوفات ارتباط الجينات وشبكات التفاعل البروتين-بروتين لدمج متعدد الأوميكس للمessenger-RNA، micro-RNA، وDNA methylation. يمكّن هذا الدمج الشبكات من التركيز الديناميكي على العلاقات المهمة بين الكيانات الحيوية، مما يحسن أداء النموذج وقدرته على التفسير. بين النماذج، حقق نموذج LASSO-MOGAT ذو الهيكل البياني القائم على الارتباط دقةً غير مسبوقة (95.9%) وأفضل أداءً من نماذج LASSO-MOGCN وLASSO-MOTGN فيما يتعلق بالدقة والاستدعاء ومتوسط الـ F1. تظهر نتائجنا أن دمج بيانات متعددة الأوميكس في الهياكل البيانية يعزز أداء تصنيف السرطان من خلال كشف الأنماط الجزيئية المميزة التي تسهم في فهم أفضل لبيولوجيا السرطان والعلامات الحيوية المحتملة لتقدم المرض.