HyperAI
Back to Headlines

علماء يطورون خوارزمية جديدة miniQuant لحل مشكلة تquantification الجينات البديلة بدقّة عالية

منذ 2 أيام

علماء يطورون خوارزمية جديدة تُدعى miniQuant لحل مشكلة تقدير الأيزوفورمات الجينية في اختبارات معيارية، أثبتت خوارزمية miniQuant-H فعاليتها بشكل ملحوظ. خلال التجارب على البيانات المحاكاة، حققت الخوارزمية متوسط خطأ مطلق للنسبة الوسطية (MARD) يبلغ 0.1249، وهو أفضل من أدوات التقنية القصيرة (0.1505-0.3555) وأدوات التقنية الطويلة (0.2515-0.9394). في جانب التحقق من البيانات الحقيقية، استخدم الفريق بيانات الرنا المركبة المعلمة التي تم جمعها من خلال اتحاد LRGASP. بالنسبة للبيانات المعلمة ERCC، والتي تحتوي على هيكل جيني بسيط، لم تكن هناك أخطاء كبيرة في التحليل بسبب عدم وجود تداخل بين الهياكل. ومع ذلك، أدوات التقنية الطويلة تعاني من أخطاء عينية أكبر مقارنة بأدوات التقنية القصيرة، بينما حققت miniQuant-H دقة مشابهة لأدوات التقنية القصيرة. بالنسبة للبيانات المعلمة SIRV، التي تحتوي على هيكل جيني معقد، أظهرت أدوات التقنية الطويلة أفضل أداء، لكن miniQuant-H حققت أقل متوسط خطأ، مما يدل على فعاليتها في تحليل البيانات المعقدة. استخدم الفريق البحثي خوارزمية miniQuant في دراسة عملية تمايز الخلايا الجذعية الجنينية (ESC) إلى طبقة البلعوم (PE) والخلايا الجرثومية الأولية (PGC). تمكنت الخوارزمية من تحديد 151 حالة من ESC إلى PE و161 حالة من ESC إلى PGC، حيث حدثت تحولات في الأيزوفورمات الجينية. هذه الاكتشافات تحمل أهمية بيولوجية كبيرة، مثل جين MAT2B، الذي رغم استقرار مستواه التعبيري العام، فإن أيزوفورماته تغيرت بشكل واضح، مما قد يؤثر على قدرة الخلية على التحكم في التكاثر. من الجدير بالذكر أن العديد من هذه التحولات الجينية المهمة تحدث في الجينات ذات التعبير العالي (من 82% إلى 99% من الجينات، بمعدل TPM من 30.60 إلى 1,077.09). عند استخدام تقنية العين الطويلة (مثل cDNA-ONT) وعمق القراءة التقليدي (مثل 60 مليون قراءة)، يتسبب الخطأ العيني في تقليل دقة النتائج عند مستويات التعبير المرتفعة. ومع ذلك، استطاعت miniQuant-H من خلال دمج البيانات القصيرة أن تحقق دقة ثابتة في نطاقات التعبير الأعلى. مقارنة بالطرق المركبة الحالية، أظهرت خوارزمية miniQuant مزايا تقنية واضحة. على سبيل المثال، يستخدم StringTieMix استراتيجية توزيع البسيطة، حيث يتم توزيع كل قراءة قصيرة على الأيزوفورمات الأكثر دعماً من القراءات الطويلة، مما يحد من فعاليته في البيانات المحاكاة. بينما استخدمت miniQuant-H نموذج تعلم آلي معقد ودوال تشابه مركبة، مما مكّنها من تحقيق تجميع البيانات الأكثر دقة ومرونة. يقول القائد العام للبحث: "هذه هي المرة الأولى التي يتم فيها إبلاغ الباحثين عن الجينات المعقدة والجينات البسيطة، وكيفية اختيار التقنيات المناسبة للقياس. في السابق، كان الجميع يعتمدون على الخبرة والتجارب، أما الآن فقد قدمنا إطاراً علمياً قياسياً." أحد المراجعين أيضاً أشاد بهذا البحث بأنه "أجاب على السؤال الذي ظل معلقاً لفترة طويلة في مجال الرنا". حالياً، تم نشر برنامج miniQuant على منصة GitHub (https://github.com/Augroup/miniQuant) بشكل مفتوح المصدر، ويوفر نماذج تدريب مخصصة للمنصات والعمق المتباين للقراءات، بما في ذلك cDNA-PacBio وcDNA-ONT وdRNA-ONT. مع استمرار تطور تقنيات القراءة الطويلة وانخفاض تكلفتها وتحسين دقتها، يمكن لهذا الأسلوب الذكي لتجميع القراءات الطويلة والقصيرة أن يوفر حلولاً أكثر دقة وكفاءة لدراسات الرنا، مما يدفع بحوث وظائف الأيزوفورمات الجينية إلى مستويات أعمق.

Related Links