HyperAI

تم اختيار جامعة تشجيانغ لـ AAAI 2025، واقترحت نموذج الانحدار متعدد إلى واحد M2OST، والذي يستخدم صور علم الأمراض الرقمية للتنبؤ بدقة بالتعبير الجيني

特色图像

يمكن لصور علم الأمراض الرقمية، مثل صور علم الأمراض الكاملة (WSIs)، تقديم أقسام الأنسجة رقميًا بدقة عالية وعرض مورفولوجيا الخلايا وبنيتها وخصائص التوزيع المكاني بشكل شامل. بالمقارنة مع الشرائح الزجاجية التقليدية، فإن شرائح WSI ليست أسهل في التخزين والتحليل فحسب، بل إنها توفر أيضًا وجهات نظر أكثر سهولة في فهم الأنسجة على مقاييس متعددة. ولذلك، يتم استخدامها بشكل متزايد في التشخيص المرضي والبحوث الطبية الحيوية. ومن خلال تحليل هذه الصور، يستطيع الباحثون استكشاف العلاقة الجوهرية بين التنظيم المكاني الخلوي والتعبير الجيني، وبالتالي الكشف عن آليات التنظيم النسخي المعقدة في الأنظمة متعددة الخلايا.

في السنوات الأخيرة، أصبحت تقنية النسخ المكاني (ST)، باعتبارها تقنية توسعة مكانية لتسلسل الحمض النووي الريبي للخلية الواحدة، أداة مهمة لدراسة توزيع وتفاعل والآليات الجزيئية للأنواع الفرعية من الخلايا. ومع ذلك، بسبب ارتفاع تكاليف المعدات والكواشف، لا تزال تقنية ST تواجه صعوبات في نشرها في التطبيقات العملية. وبالمقارنة، فإن WSIs أكثر اقتصادية ويمكن الوصول إليها للتطبيقات السريرية. لذلك، أصبحت كيفية إعادة بناء خرائط ST من WSIs بتكلفة منخفضة بمساعدة التعلم العميق اتجاهًا بحثيًا جذب الكثير من الاهتمام.

تنظر معظم الطرق الحالية إلى مشكلة التنبؤ بالنقطة ST باعتبارها مشكلة انحدار تقليدية وتستخدم أزواجًا من الصور والعلامات ذات المستوى الواحد للتدريب. يقتصر هذا على نمذجة علاقات التعبير الجيني فقط للصور ذات التكبير الأقصى، مما يؤدي إلى إهدار المعلومات متعددة المقاييس المتأصلة في WSIs.

وبناء على هذه المشكلة،اقترح فريق البحث التابع للبروفيسور لين لانفين من جامعة تشجيانغ في الصين، بالتعاون مع مختبر تشجيانغ هانغتشو تشجيانغ وجامعة ريتسوميكان في اليابان، نموذج M2OST، وهو نموذج محول الانحدار من العديد إلى واحد والذي يهدف إلى التنبؤ المشترك بالتعبير الجيني باستخدام الصور المرضية على مستويات مختلفة.من خلال دمج المعلومات المرئية لنقاط أخذ العينات والميزات متعددة المقاييس في WSIs، يصبح النموذج قادرًا على إنشاء خرائط ST أكثر دقة. بالإضافة إلى ذلك، قام فريق البحث أيضًا بفصل عملية استخراج الميزات متعددة الطبقات من العديد إلى واحد إلى استخراج الميزات داخل الطبقة واستخراج الميزات عبر الطبقات، مما يقلل بشكل كبير من التكلفة الحسابية ويحسن الكفاءة الحسابية دون التأثير على أداء النموذج.

تم اختيار النتائج ذات الصلة لـ AAAI 2025 تحت عنوان "M2OST: الانحدار من العديد إلى واحد للتنبؤ بالنسخ المكاني من صور علم الأمراض الرقمية".

أبرز الأبحاث:* تصور مشكلة التنبؤ بالنقطة المكانية باعتبارها مشكلة نمذجة من عدة إلى واحد، والتنبؤ المشترك بخريطة النقطة المكانية باستخدام معلومات متعددة المقاييس وميزات بين النقاط المضمنة في WSIs الهرمية. * اقتراح نموذج محول M2OST يعتمد على الانحدار من عدة إلى واحد، وهو قوي لمجموعات الإدخال ذات أطوال تسلسل مختلفة.
* فصل عملية استخراج الميزات متعددة المقاييس في M2OST إلى استخراج الميزات داخل الطبقة واستخراج الميزات عبر الطبقات، مما يحسن بشكل كبير من الكفاءة الحسابية دون التأثير على أداء النموذج
* تم إجراء تجارب شاملة على طريقة M2OST المقترحة وتم إثبات فعاليتها على ثلاث مجموعات بيانات ST عامة.

عنوان الورقة:
https://hyper.ai/cn/sota/papers/2409.15092
قم بالتركيز على هايبرالحساب WeChat العام، قم بالرد بـ "M2OST" في الكواليس للحصول على ملف PDF الكامل

يجمع مشروع المصدر المفتوح "awesome-ai4s" أكثر من 200 تفسير لورقة AI4S ويوفر مجموعات بيانات وأدوات ضخمة:
https://github.com/hyperai/awesome-ai4s

مجموعة البيانات: استخدم 3 مجموعات بيانات ST لإثبات فعاليتها

استخدم فريق البحث ثلاث مجموعات بيانات عامة لتقييم أداء نموذج M2OST المقترح:

*مجموعة بيانات سرطان الثدي البشري (HBC):ويحتوي على 30,612 موضعًا في 68 من WSIs، كل منها يحتوي على 26,949 جينًا مختلفًا على الأكثر. النقاط في مجموعة البيانات هذه لها قطر 100 ميكرومتر ومرتبة في شبكة بمسافة مركزية تبلغ 200 ميكرومتر.

*مجموعة بيانات أورام الثدي الإيجابية لدى البشر (HER2):يتكون من 36 صورة مرضية و 13594 نقطة، تحتوي كل منها على 15045 بيانات مسجلة للتعبير الجيني. تبلغ المسافة المركزية بين كل نقطة تم التقاطها من بيانات ST في مجموعة البيانات هذه 200 ميكرومتر، ويبلغ قطر كل نقطة 100 ميكرومتر.

*مجموعة بيانات سرطان الخلايا الحرشفية الجلدية البشرية (cSCC):تتضمن 12 مؤشرًا للأسعار و8671 نقطة. تم تحليل 16,959 جينًا في كل موضع في هذه المجموعة من البيانات. يبلغ قطر جميع النقاط 110 ميكرومتر ويتم ترتيبها في مجموعة مستطيلة متوسطة الحجم مع مسافة مركزية تبلغ 150 ميكرومتر.

نموذج M2OST: هيكل الانحدار من العديد إلى واحد، والصور المرضية متعددة المستويات تتنبأ بشكل مشترك بالتعبير الجيني

في السنوات الأخيرة، أصبح التنبؤ بملفات النسخ المكاني (ST) من صور علم الأمراض الكاملة (WSIs) نقطة بحثية ساخنة في مجال علم الأمراض الرقمي. تؤدي الطرق المبكرة مثل ST-Net و DeepSpaCE إلى تنفيذ التنبؤ بـ ST على مستوى رقعة الصورة استنادًا إلى الشبكات العصبية التلافيفية (CNN). يقدم إطار عمل التضمين ثنائي النمط BLEEP الذي تم إصداره مؤخرًا استراتيجية تعلم متباينة لمواءمة ميزات تصحيح صورة WSI مع تضمينات نقطة ST، ويقدم خوارزمية أقرب جار K لتخفيف مشكلة تأثير الدفعة في مرحلة الاستدلال.

مع ظهور النماذج المعتمدة على المحولات، أصبح أداؤها يفوق أداء شبكات CNN التقليدية. قدم نموذج التعلم العميق HisToGene برنامج Transformer في التنبؤ بالتعبير الجيني لأول مرة، مما أدى إلى تحقيق النمذجة على مستوى الشريحة وتحسين الكفاءة ولكن لا يزال محدودًا بموارد الحوسبة. يدمج نموذج Hist2ST شبكات CNN والمحولات والشبكات العصبية الرسومية لالتقاط المزيد من التبعيات طويلة المدى.ومع ذلك، فإن هيكل النموذج المعقد يؤدي أيضًا إلى زيادة خطر الإفراط في التجهيز.

على عكس الفكرة السائدة المتمثلة في التركيز على الارتباط بين نقاط أخذ العينات، فإن iStar، وهي طريقة تعتمد على استخراج ميزات الصورة الهرمية، تؤكد على أن التعبير الجيني داخل نقطة أخذ العينات يرتبط فقط بمنطقة كتلة الصورة المقابلة لها، وتستخدم HIPT المدربة مسبقًا لاستخراج الميزات، وتربطها بقيم التعبير من خلال MLP، مع أداء ممتاز.ومع ذلك، نظرًا لأن الميزات غير قابلة للتعلم، فما زال هناك مجال لمزيد من التحسين.

مستوحى من هذا، قام فريق البحثيستخدم M2OST أيضًا حلًا على مستوى كتلة الصورة.توقع نقطة عينة واحدة في كل مرة لضمان استقلالية ودقة كل توقع.كما قام فريق البحث بتوسيع أفكار iStar بشكل أكبر وصمم مجموعة من وحدات استخراج الميزات والاندماج متعددة المقاييس والتي يمكن تعلمها. ومن خلال النمذجة التفصيلية للمناطق المحلية وتكامل المعلومات عبر نطاق واسع، تم تحسين قدرة النموذج التنبؤية في ظل الهياكل التنظيمية المعقدة.

كما هو موضح في الشكل أدناه، يتم إدخال ثلاث تسلسلات من رقعة الصور من مستويات مختلفة من صور علم الأمراض الكاملة (WSIs) في النموذج للتنبؤ بشكل مشترك بالتعبير الجيني للمواقع المقابلة.

بعد تلقي كتل الصور المرضية من 3 مستويات مختلفة،أولاً، يقوم M2OST بإدخالها في طبقة Deformable Block Embedding (DPE).لتحقيق توليد الرمز التكيفي. لا يقوم DPE باستخراج بقع الأمراض الأساسية من كل صورة فحسب، بل يقوم أيضًا بإدخال بقع ذات حجم أكبر في صور الأمراض عالية المستوى لالتقاط معلومات سياقية أوسع.

في الوقت نفسه، يقوم DPE بإنشاء رموز دقيقة داخل النقطة ورموز محيطة خشنة لتعزيز تركيز النموذج على ميزات المنطقة المركزية لنقطة أخذ العينات، وبالتالي تسليط الضوء على ميزات بين النقاط في عملية النمذجة المتعددة إلى واحد وتوفير تمثيل ميزة أكثر دقة وهيكلة للتنبؤ بالتعبير اللاحق.

مخطط نموذج M2OST

DPE المستخدمة في M2OST

بعد ذلك، تتم إضافة رمز cls إلى كل تسلسل، وكما هو موضح في PE في الشكل، يتم تقديم ترميز الموضع القابل للتعلم. تستخدم M2OST وحدة الرمز الهجين الداخلية (ITMM) لاستخراج ميزات داخل الطبقة لكل تسلسل. تم بناء ITMM على بنية Vision Transformer ويقدم آلية Random Mask Self-Attention (Rand Mask Self-Attn) لتعزيز قدرة التعميم للنموذج في عملية نمذجة الصور.

هيكل شبكة ITMM

بعد اكتمال استخراج الميزات داخل الطبقة، يقدم M2OST وحدة خلط الرموز عبر الطبقات (CTMM) لتعزيز تفاعل المعلومات عبر الطبقات بين تسلسلات متعددة الطبقات.بسبب الاختلافات في أطوال تسلسلات الإدخال متعددة المقاييس، يقدم CTMM آلية انتباه عبر الطبقات متصلة بالكامل لتجنب تشويه المعلومات الناجم عن الاندماج المباشر مع الحفاظ على الاستقلال النسبي لمعلمات كل فرع مقياس.وبعد ذلك، من أجل تعزيز قدرة تبادل المعلومات عبر المقاييس على مستوى القناة، قدمت M2OST وحدة خلط القنوات عبر الطبقات (CCMM) بعد CTMM.

يعتمد CCMM على تصميم هيكلي غير حساس لطول التسلسل.يقوم CTMM بدمج المعلومات السياقية عبر المقاييس بشكل ديناميكي استنادًا إلى تشابه الانتباه والأوزان القابلة للتعلم بين الطبقات المختلفة، ويخرج تسلسلات متعددة الطبقات من نفس الشكل.أولاً، يتم إجراء تجميع المتوسط العالمي على تسلسل كل طبقة لضغط معلومات التسلسل الخاصة بها في تمثيل رمزي. بعد ذلك، يتم دمج رموز الطبقات المختلفة معًا، ويتم حساب درجة اهتمام القناة عبر الطبقات بالاشتراك مع آلية حافز الضغط (الضغط والإثارة). ويتم بعد ذلك ربط هذه النتائج بتسلسلات الإدخال الخاصة بها، مما يكمل تبادل المعلومات عبر المقاييس على مستوى القناة.

(أ) هيكل شبكة CTMM. (ب) هيكل الشبكة لـCCMM.

تشكل عملية نمذجة الميزات متعددة المقاييس هذه ككل وحدة التشفير الخاصة بـ M2OST ويتم تكرارها N مرة في جميع أنحاء الشبكة لإثراء التمثيل المعبر للصورة متعددة المستويات تدريجيًا والمطلوب للتنبؤ بالنسخ المكاني.أخيرا،يتم ربط رموز cls الثلاثة وإدخالها في رأس الانحدار الخطي للتنبؤ بنقطة ST.

النتائج التجريبية: يثبت التقييم متعدد الأبعاد فعالية نموذج M2OST

قام فريق البحث بمقارنة شاملة لأداء M2OST مع مجموعة متنوعة من الأساليب السائدة على مجموعات بيانات متعددة. وتظهر النتائج التجريبية في الجدول التالي.يحقق M2OST أداءً متفوقًا مع عدد أقل من المعلمات وعدد أقل من FLOPs.بالمقارنة مع ST-Net، تم تقليل عدد معلمات M2OST بمقدار 0.40M، وتم تقليل FLOPs بمقدار 0.63G، وتم تحسين معامل ارتباط بيرسون (PCC) لـ M2OST على مجموعات بيانات HER2 + و cSCC بمقدار 1.16% و 1.13% على التوالي.

النتائج التجريبية المقارنة لـ M2OST والطرق الأخرى

مقارنة M2OST مع طرق متعددة المقاييس واحد لواحد:

كما قام فريق البحث بمقارنة M2OST مع طرق متعددة المقاييس واحدة لواحدة مثل CrossViT و HIPT / iStar. وبالمقارنة مع ViT القياسي، يظهر CrossViT قدرات انحدار ST أقوى، مما يؤكد المزايا المهمة لدمج المعلومات متعددة المقاييس في هذه المهمة. ومع ذلك، فإن CrossViT لديه بعض القيود في نمذجة المعلومات داخل النقطة، ولا يزال أداؤه الإجمالي أدنى من M2OST.

علاوة على ذلك، يعمل iStar بشكل جيد في دقة التنبؤ بـ ST، مما يوضح فعالية بنية HIPT في استخراج الميزات متعددة المقاييس من WSI. ومع ذلك، من أجل توفير تكلفة الحساب، يستخدم iStar أوزان HIPT ثابتة لتوليد ميزات WSI للتنبؤ بـ ST، مما يحد من قدرته على استخراج الميزات. وفي الوقت نفسه، من حيث كفاءة الاستدلال، تعمل عملية الاستخراج كتلة تلو الأخرى وعلى نطاق تلو الآخر من iStar على زيادة وقت المعالجة بشكل كبير. تظهر نتائج البحث أنه عند التشغيل تحت نفس حد ذاكرة وحدة معالجة الرسوميات، تكون سرعة الاستدلال لـ M2OST أسرع بحوالي 100 مرة من iStar، ولا يزال أداءها أفضل من الأخير، مما يوضح تمامًا إمكانات التدريب الشامل في مهام الانحدار ST وفعالية نموذج M2OST.

مقارنة بين طرق ST على مستوى رقعة الصورة ومستوى الشريحة:

تظهر النتائج التجريبية أن أداء طرق مستوى الشريحة على مجموعات البيانات الثلاث أقل عمومًا من أداء طرق مستوى كتلة الصورة. على الرغم من أن Hist2ST يظهر أداءً أفضل من HisToGene، إلا أن عدد معلماته الكبير وFLOPs العالية تجعل تحسن الأداء هذا غير ذي أهمية. بالمقارنة مع طرق مستوى كتلة الصورة الأساسية مثل ST-Net، يتم تقليل PCC لـ Hist2ST على مجموعات البيانات الثلاث بمقدار 2.78% و2.99% و2.66% على التوالي. يشير هذا إلى أن التعبير الجيني لنقطة ما يرتبط بشكل أساسي بمنطقة الأنسجة المقابلة لها، وأن إدخال الارتباط بين النقاط لا يحسن دقة التنبؤ بشكل كبير. ومع ذلك، لا تزال طريقة مستوى الشريحة أكثر كفاءة في إنشاء خرائط ST كاملة، ولا يزال هناك إمكانية لتحقيق دقة الانحدار التنافسية من خلال تحسين تصميم الشبكة في المستقبل.

التحليل البصري:

(أ) تصور ملف النسخ المكاني (ST) بعد تحليل المكونات الرئيسية (PCA). (ب) تصور التوزيع المكاني لجين DDX5.

قام فريق البحث بتحليل ومقارنة نتائج التصور لطرق مختلفة في التنبؤ بخريطة ST. أظهرت النتائج أن طرق مستوى الشريحة (مثل HisToGene وHist2ST) يمكنها عادةً إنشاء خرائط أكثر سلاسة، بينما تحتفظ طرق مستوى كتلة الصورة بميزات هيكلية محلية أكثر وضوحًا.

ومن الجدير بالذكر أن M2OST قادر دائمًا على إنشاء خرائط ST أكثر دقة، مما يوفر دقة تنبؤ أعلى. كما قام فريق البحث بتصور التعبير عن الجين الرئيسي DDX5، والذي يلعب دورًا رئيسيًا في انتشار الخلايا السرطانية غير الصغيرة وتكوين الأورام من خلال تنشيط مسار إشارات β-catenin. وأظهرت النتائج أن M2OST كان أفضل أداء في التنبؤ بهذا الجين، متفوقًا على جميع الطرق المقارنة، مما يؤكد دقة نموذج M2OST على مستوى التنبؤ بالتعبير الجيني الفردي.

التقدم المذهل والتطبيقات عبر المجالات لتحليل النسخ المكاني

يمكن لتحليل النسخ المكاني، باعتباره جسرًا يربط بين وظيفة الخلية وبنية الأنسجة، تحليل أنماط التعبير الجيني للخلايا الفردية في الزمان والمكان، والكشف عن الموقع المكاني والخصائص البيولوجية لمجموعات الخلايا، وهو ما يدفع البحث الطبي الحيوي إلى مستوى أعمق.

وفي هذا المجال، بحلول أبريل 2025،قام فريق بحثي من معهد العلوم الطبية بجامعة طوكيو في اليابان بتطوير إطار عمل التعلم العميق STAIG لتحليل النسخ المكاني استنادًا إلى التعلم التبايني للرسم البياني بمساعدة الصور.يتمتع الإطار بالقدرة على دمج التعبير الجيني والبيانات المكانية والصور النسيجية دون الحاجة إلى محاذاة البيانات، وبالتالي التغلب على قيود الطرق التقليدية في القضاء على تأثيرات الدفعة وتحديد المناطق المكانية. يقوم STAIG باستخراج الميزات من الصور الملطخة بالهيماتوكسيلين والإيوزين (H&E) من خلال التعلم الذاتي الإشرافي دون الاعتماد على مجموعات بيانات واسعة النطاق للتدريب المسبق.

أثناء التدريب، يقوم STAIG بتعديل بنية الرسم البياني بشكل ديناميكي ويستبعد بشكل انتقائي العينات السلبية غير ذات الصلة من خلال الصور النسيجية، مما يقلل من التحيز. وفي النهاية، نجح STAIG في تحقيق تكامل الدفعات من خلال تحليل القواسم المشتركة للتعبير الجيني من خلال المقارنة المحلية، وتجنب تعقيد محاذاة الإحداثيات اليدوية والحد بشكل كبير من تأثيرات الدفعات. أظهرت الدراسات أن STAIG يعمل بشكل جيد على مجموعات بيانات متعددة، وخاصة في تحديد المنطقة المكانية، ويمكنه الكشف عن معلومات جينية ومكانية مفصلة في البيئة الدقيقة للورم، مما يدل على إمكاناته المهمة لتحليل تعقيد البيولوجيا المكانية.

انقر لعرض تقرير مفصل: لا حاجة للمحاذاة المسبقة للقضاء على تأثيرات الدفعة، فقد طور فريق جامعة طوكيو إطار عمل التعلم العميق STAIG للكشف عن المعلومات الجينية التفصيلية في بيئة الورم.

وفي الوقت نفسه، حقق فريق البحث التابع لـوي وو في مختبر لينجانج في شنغهاي بالصين تقدماً كبيراً في مجال النسخ المكاني. في نوفمبر 2024، نشر الفريق ورقة بحثية بعنوان "MCGAE: كشف غزو الورم من خلال النسخ الجيني المكاني المتعدد الوسائط المتكامل" في مجلة Briefings in Bioinformatics. طورت هذه الدراسة إطار عمل للتعلم العميق MCGAE (مشفر تلقائي متعدد المشاهدات للرسوم البيانية التباينية) مصمم خصيصًا لتحليل بيانات النسخ المكاني.يعمل هذا الإطار على إنشاء تمثيلات بيولوجية متعددة الوسائط ومتعددة وجهات النظر من خلال الجمع بين التعبير الجيني والإحداثيات المكانية وميزات الصورة، مما يحسن بشكل كبير دقة التعرف على المجال المكاني.تُظهر بيانات الورم تحديدًا دقيقًا لمناطق الورم وتحليلًا متعمقًا للخصائص التنظيمية الجزيئية، مما يوفر أداة قوية لأبحاث الأنسجة المعقدة، وأبحاث آلية المرض، واكتشاف هدف الدواء.

الورق الأصلي:
https://academic.oup.com/bib/article-pdf/26/1/bbae608/60786360/bbae608.pdf

علاوة على ذلك، فإن تطبيق النسخ المكاني في الزراعة يظهر أيضًا إمكانات كبيرة. في أبريل 2025، نشر فريق بحثي من معهد أبحاث الزراعة الحديثة بجامعة بكين دراسة مهمة بعنوان "التغيرات المكانية الزمنية تكشف عن التنظيم الجيني الرئيسي لإنتاج الحبوب وجودتها في القمح" في مجلة Genome Biology.باستخدام تقنية النسخ المكاني، تم إنشاء خريطة عالية الدقة للتعبير الجيني لحبوب القمح في فترات زمنية مختلفة أثناء التطور المبكر.كشف عن خصائص التعبير الجيني أثناء نمو حبوب القمح. لا يوفر هذا البحث دعمًا نظريًا مهمًا لتربية التصميم الجزيئي وتحسين إنتاج القمح فحسب، بل يوفر أيضًا ضمانًا قويًا للأمن الغذائي العالمي.

الورق الأصلي:
https://www.biorxiv.org/content/biorxiv/early/2024/06/03/2024.06.02.596756.full.pdf

في المستقبل، مع التراكم المستمر لبيانات النسخ المكاني والتحسين المستمر لطرق الحصول على صور علم الأمراض الرقمية، فإن التكامل العميق لتقنيات الذكاء الاصطناعي والأوميكس سيعزز التطبيق الواسع النطاق لنماذج التعلم العميق في أنواع مختلفة من الأنسجة وخلفيات الأمراض، ويساعد في تطوير الطب الدقيق. أرسى اقتراح M2OST أساسًا متينًا لبناء إطار عمل فعال ومنخفض التكلفة وعالي الدقة للتنبؤ بالتعبير الجيني المكاني، ويبشر بآفاق عميقة للذكاء الاصطناعي وتحليل اندماج البيانات متعددة الأوميكس في المجال الطبي الحيوي.