HyperAI

إنجاز جديد لمعهد فودان لعلوم الدماغ: استخدام التجزئة الدلالية كمرجع لتطوير أداة شرح دلالي للنسخ المكاني

特色图像

منذ اختيارها كتكنولوجيا العام من قبل Nature Methods في عام 2020،لقد أصبحت تقنية "النسخ الجيني المكاني" واحدة من أكثر التقنيات الثورية رواجًا في مجال علوم الحياة اليوم.وبعبارة بسيطة، تستطيع هذه التقنية الحصول على معلومات مكانية عن الأنسجة وبيانات النسخ الجيني، وتحليل أنماط التعبير الجيني داخل الأنسجة بدقة، فضلاً عن الخصائص البيولوجية مثل العلاقة بين الموقع المكاني لمجموعات الخلايا من أبعاد الزمان والمكان. وهو ذو قيمة كبيرة في الأبحاث في مجالات أبحاث الأمراض، والنمو والتطور، وبنية الأعضاء، وتطور الأنواع.

مع استمرار شعبية التحليل النسخي المكاني في البحث الأكاديمي، ظهرت أيضًا تقنيات التحليل النسخي المكاني مثل 10x Visium وSlide-seq وStereo-seq. إن هذه الإنجازات والتطورات الأخيرة تغير بشكل كامل الأبحاث البشرية حول أنماط التعبير الجيني في الأنسجة. ومع ذلك، فإن مجرد الحصول على ملف التعبير الجيني في إحداثيات فيزيائية محددة داخل الأنسجة لا يكفي لفهم تعقيد الأنظمة البيولوجية بشكل كامل. ولكي نفهم التعقيد بشكل كامل، فمن الضروري تحديد الهوية البيولوجية لكل نقطة مكانية داخل الأنسجة.

في الوقت الحالي، يتم استخدام الأساليب القائمة على التعلم الآلي على نطاق واسع لتحديد مجموعات من النقاط المكانية وتفسير هوياتها البيولوجية باستخدام الجينات المحددة.ومع ذلك، فإن هذه الأساليب غالباً ما تكون محدودة بسبب افتقارها إلى القدرة على إقامة اتصالات واضحة مع الهياكل المعروفة داخل المجموعة.بالإضافة إلى ذلك، غالبًا ما يتم استخدام التوضيح اليدوي للمساعدة في تحديد الهياكل المعروفة، ولكن هذه الطريقة غالبًا ما تكون محدودة بخبرة الباحثين وحكمهم الذاتي ولا يمكن تطبيقها على التحليل واسع النطاق.

ردًا على التحديات المذكورة أعلاه، نشر فريق تشو ينغ من معهد علوم الدماغ بجامعة فودان مؤخرًا نتيجة بحث بعنوان "بيانو: إطار عمل احتمالي يعمل على أتمتة التعليقات الدلالية لتحليل النسخ المكاني" في مجلة "Nature Communications".استعار فريق البحث فكرة "التجزئة الدلالية" من الرؤية الحاسوبية، واقترح مفهوم "التعليق الدلالي المكاني للنسخ الجيني"، وقام بتطوير أداة التعليق الدلالي المكاني للنسخ الجيني Pianno.إن القدرة على تحديد الهياكل أو أنواع الخلايا تلقائيًا للنقط المكانية داخل الأنسجة يمكن أن تجمع المعلومات من أبعاد متعددة لتعزيز تفسير الأنظمة البيولوجية المعقدة.

أبرز الأبحاث:

* يتمتع Pianno بوضع وسم تلقائي فريد من نوعه يمكن تطبيقه على البيانات التي تم إنشاؤها بواسطة تقنيات النسخ المكاني المختلفة

* يُظهر بيانو أداءً متفوقًا مقارنةً بأساليب التجميع المكاني المتطورة، مما يوفر رؤى جديدة في بيانات النسخ المكاني

عنوان الورقة:
https://doi.org/10.1038/s41467-024-47152-4

مجموعة البيانات: بيانات عامة وحسابات دقيقة

تتكون مجموعات البيانات المستخدمة في هذه الدراسة بشكل أساسي من مجموعات بيانات عامة من منصات تقنية مكانية مختلفة، بما في ذلك مجموعة بيانات القشرة الجبهية الظهرانية البشرية dlPFC، ومجموعة بيانات مقطع تاج نصف الكرة المخية لدى الفئران البالغة Stereo-seq، ومجموعة بيانات معالجة الحُصين المسبقة لدى الفئران Slide-seqV2، ومجموعة بيانات سرطان القناة البنكرياسية البشرية ST، ومجموعة بيانات سرطان الثدي لدى البشر Visium، ومجموعة بيانات القشرة البصرية الأولية لدى الفئران scRNA-seq، ومجموعات بيانات snRNA-seq لمناطق قشرية بشرية متعددة، وصور تلطيخ DAPI للبصلة الشمية لدى الفئران.

وفي الدراسة، من أجل تجنب تدمير السمات البيولوجية الأصلية من خلال تقنيات معالجة الصور مثل تقليل الضوضاء والتنعيم والحدة،قام فريق البحث ببناء مصنف بايزي يعتمد على الأعداد الخام لضبط التعليقات التوضيحية الأولية.وفي الوقت نفسه، طبق فريق البحث نموذج ماركوف الميداني العشوائي عالي الترتيب (MRF). في سياق النسخ المكاني، وبما أنه يجب النظر إلى التعبير الجيني والموقع المكاني لكل موقع معًا، فقد اعتمد فريق البحث أيضًا نموذج عملية نقطة بواسون المكانية (sPPP).

بيانو: أداة جديدة ومبتكرة للتعليق الدلالي الآلي على النسخ المكاني

واقترح فريق البحث أداة جديدة تسمى Pianno تعتمد على الإطار البايزي.تجمع الأداة بين حقول ماركوف العشوائية (MRFs) وعمليات نقطة بواسون المكانية (sPPPs)، مما يجعل الاستفادة الكاملة من قدرة sPPPs على نمذجة توزيع بيانات تعداد RNA-seq مع مراعاة معلومات موقع النقاط المكانية. يمكنه التعليق تلقائيًا على الهوية البيولوجية لكل نقطة في بيانات النسخ المكاني باستخدام قائمة محددة مسبقًا من الجينات المحددة.

إطار البيانو

تتكون بيانات النسخ المكاني المدخلة بواسطة Pianno من إحداثيات مكانية وقائمة الجينات الأولية وعدد الجينات الخام.يوفر كل نمط رمزًا معروفًا واحدًا على الأقل.

تتكون عملية التوضيح من خطوة التجزئة الأولية وخطوة التحسين:

في خطوة التجزئة الأولية،تم تحويل التعبير المكاني لكل جين إلى صورة بدرجات الرمادي. بالنسبة لكل نمط مستهدف، يتم إنشاء صورة نمطية عن طريق تجميع الصور ذات التدرج الرمادي لجينات العلامات المرتبطة بهذا النمط، ثم يتم تحديد جينات علامات مرشحة إضافية لكل نمط لتحديث قائمة العلامات الأولية. سيتم دمج قوائم العلامات المحدثة في خطوات التحسين اللاحقة، مع الأخذ في الاعتبار أنماط التعبير الفريدة الخاصة بها في الهياكل الموضحة مبدئيًا.

في خطوة التحسين،يتم إنشاء مصنف بايزي لتقييم الاحتمال الخلفي بأن كل نقطة مكانية تنتمي إلى أوضاع مختلفة، ومن ثم يتم تحديث الشرح بناءً على الاحتمال الخلفي.

يوفر Pianno طريقتين لتحديث التعليقات التوضيحية:

* بالنسبة للأنماط المستمرة في التعليق الدلالي، يوصى باستخدام توزيع الاحتمالات كصورة نمط وإعادته إلى كاشف النمط لتحديث التعليق الدلالي؛ * بالنسبة لأنماط الصور المتناثرة أو الحادة، يوصى بتحديث الملصق مباشرةً استنادًا إلى قيمة الاحتمالية لأنه يمكنه الاحتفاظ بالمعلومات التفصيلية.

على العموم،قام بيانو بتبسيط عملية التوضيح واعتمد نهجًا استدلاليًا لاستخدام جين علامة أولي واحد لتحديد جينات علامة إضافية، مما يمكن أن يقلل من إدخال عدد العلامات المعروفة.

نتائج البحث: أداء ممتاز وقابلية تطبيق قوية

في هذه الدراسة، قام فريق البحث بالتحقق من أداء بيانو ودقته وقدرته على التكيف، وأظهر قدرات بيانو بشكل أكبر من خلال مقارنته بالطرق الموجودة.

في مقارنة مع الأدوات القائمة على التجميع لتوضيح البنية التشريحية، قام فريق البحث بتقييم أداء Pianno باستخدام 12 عينة من مجموعة بيانات dlPFC وقارنها مع CellAssign، وهي طريقة توضيح أخرى تعتمد على العلامات ولكن بدون معلومات مكانية. بالإضافة إلى ذلك، تم أيضًا أخذ طريقة التجميع غير الخاضعة للإشراف خوارزمية ليدن وخمس طرق تجميع مكاني (SpaGCN وSEDR وBayesSpace وDeepST وSTAGATE) في الاعتبار في عملية التقييم.

تقييم أداء بيانو في إعادة بناء القشرة المخية

ووجد التقييم أنوقد حقق أداء بيانو أعلى مستوى من الاتفاق مع التعليقات اليدوية التي أجراها باحثون ذوو خبرة استنادًا إلى السمات والعلامات المورفولوجية.تفوقت إحدى عشر عينة من أصل 12 عينة على طرق الاختبار الأخرى.

نتائج تقييم المؤشرات المتعددة

بالإضافة إلى ذلك، قام فريق البحث بتقييم الأداء المتفوق لبيانو بشكل شامل من خلال مؤشرات تصنيف أخرى، مثل الدقة (ACC)، ودقة المتوسط الكلي (P)، والتذكير المتوسط الكلي (R)، ومتوسط درجة F1 الكلي (F1) والمعلومات المتبادلة الطبيعية (NMI)، كما هو موضح في الشكل e أعلاه.المؤشرات المتعلقة بالبيانو كلها على مستوى مرتفع.

بيانو يقيس أداء شرح أنواع الخلايا في قشرة الفأر

ثم قام فريق البحث بتقييم قدرة بيانو على التنبؤ بالتوزيع المكاني لأنواع الخلايا. في هذه الجولة من التحقق، استخدم فريق البحث مجموعة بيانات Stereo-seq للمقاطع التاجية لنصف دماغ فأر بالغ وقارن النتائج بتوزيع نوع الخلية المستنتج من استراتيجيات مختلفة، بما في ذلك التجميع غير الخاضع للإشراف بعد تقسيم الخلايا، وثلاث أدوات لتفكيك مكاني تعتمد على تكامل النسخ المكاني والنسخ الخلوي الفردي.

وتوصلت الدراسة إلى أن تنبؤات بيانو لتوزيع الأنواع الفرعية للخلايا العصبية المثيرة أظهرت أنماطًا مماثلة لتلك الخاصة بتانغرام وRCTD، وكانت متسقة للغاية مع مواقعها المعروفة في كل طبقة. على العموم،تظهر هذه النتائج قوة ودقة Pianno في التنبؤ بتوزيعات أنواع الخلايا المعقدة في مجموعات البيانات المكانية، وخاصة في المواقف التي تواجه فيها الأساليب غير الخاضعة للإشراف تحديات.

ثم قام فريق البحث بتقييم أداء Pianno بشكل أكبر في شرح هياكل الشكل المختلفة في بيانات النسخ المكاني على منصات مختلفة وقارنها مع STAGATE.

أداء بيانو في شرح الهياكل ذات الأشكال المختلفة على منصات مختلفة

استخدم فريق البحث برنامج Pianno لتوضيح الهياكل التشريحية في مجموعة بيانات Stereo-seq الخاصة بالبصلة الشمية للفأر، والتي تحتوي على 10,747 نقطة مكانية تغطي كل من المناطق المغطاة بالأنسجة والمناطق الخلفية.

كان بيانو قادرًا على إجراء عمليات طرح الخلفية وشرح البنية في وقت واحد خلال دقائق. على النقيض من ذلك، عندما يتم تعيين عدد المجموعات على عدد الهياكل، يفشل STAGATE في تحديد المجموعات المقابلة لجميع الهياكل التشريحية.

كما قام فريق البحث بتقييم أداء بيانو في شرح المنظمات الهيكلية المعقدة والمشتتة في ضوء التباين العالي لبيئة الورم. قامت هذه الجولة من الاختبارات بتحليل البيئة المحيطة بعينتين من سرطان القناة البنكرياسية البشري وعينتين من سرطان الثدي.

شرح البيئة الدقيقة للورم

إجمالي،أظهر Pianno مستوى من الاتساق مع التعليقات التوضيحية اليدوية التي أجراها علماء الأمراض المحترفون، مما يدل على إمكاناته الكبيرة في التعليق على الهياكل غير المنتظمة والمعقدة، وخاصة في البيئات الدقيقة للأورام غير المتجانسة.وهذا يوفر مساعدة قيمة لعلماء الأمراض في فهم تعقيد بيولوجيا الورم، ومن المتوقع أن يقدم أفكارًا جديدة لتوفير استراتيجيات علاجية مخصصة.

إن الجمع بين الذكاء الاصطناعي وعلم الأحياء المعقد له إمكانات كبيرة

وفقًا لمعهد علوم الدماغ بجامعة فودان، تم تمويل مشروع البحث من خلال المشروع الرئيسي لبرنامج البحث والتطوير الوطني الرئيسي "التكامل البيولوجي والمعلوماتي (تكامل التكنولوجيا الحيوية وتكنولوجيا المعلومات)"، والمشروع الرئيسي للابتكار العلمي والتكنولوجي 2030 - "علم الدماغ والبحوث الشبيهة بالدماغ"، والمؤسسة الوطنية للعلوم الطبيعية، ومشروع شنغهاي الرئيسي للعلوم والتكنولوجيا ومختبر تشانغجيانغ.

من المفهوم أن معهد علوم الدماغ بجامعة فودان تأسس في أبريل 2006. وهو كيان بحثي في علم الأعصاب على مستوى المدرسة بجامعة فودان وأحد منصات الابتكار العلمي والتكنولوجي الرئيسية التي تم بناؤها في المرحلة الثانية من "مشروع 985" التابع لوزارة التعليم. إنه مشروع بناء "اثنين في واحد" مع المختبر الوطني الرئيسي لعلم الأعصاب الطبي.

منذ إنشائه، حقق معهد علوم الدماغ بجامعة فودان نتائج مثمرة. وقد استجاب المعهد مرارا وتكرارا للاحتياجات الدولية والوطنية الكبرى، وقام بتنفيذ مشاريع بحثية علمية كبرى، وأنتج نتائج بحثية مهمة. وبحسب موقعها الرسمي، أشرف الباحثون في المعهد وشاركوا في سلسلة من مشاريع البحث العلمي الكبرى، بما في ذلك برنامج "973" و"863" التابعين لوزارة العلوم والتكنولوجيا، وبرنامج الابتكار العلمي والتكنولوجي 2030 "علم الدماغ والبحوث المشابهة للدماغ"، وبرنامج البحث والتطوير الوطني الرئيسي، والمشروع الوطني الرئيسي الخاص للعلوم والتكنولوجيا "إنشاء أدوية جديدة رئيسية"، وما إلى ذلك.

في الواقع، بالإضافة إلى معهد علوم الدماغ في جامعة فودان، بدأت العديد من المختبرات والشركات أيضًا في الاهتمام بتكنولوجيا النسخ المكاني.

على سبيل المثال،قام فريق تشانغ شي هوا من معهد الرياضيات وعلوم الأنظمة، التابع للأكاديمية الصينية للعلوم، بتطوير سلسلة أدوات STA. في عام 2022، أصدر الفريق STAGATE، وهي أداة ذكاء اصطناعي لتحديد البنى الفرعية المكانية للأنسجة البيولوجية والتي يمكن تكييفها مع تقنيات النسخ المكاني المختلفة والأنسجة البيولوجية المختلفة. منذ دخول عام 2023، أصدر الفريق عددًا من النتائج حول تقنية النسخ المكاني - * إنشاء أداة تحليل متكاملة جديدة STAligner لبيانات النسخ المكاني متعددة الشرائح للأنسجة البيولوجية من تقنيات مختلفة ونقاط زمنية تنموية مختلفة وحالات مرضية مختلفة. * STAMarker، وهي طريقة لتحديد الجينات المتغيرة الخاصة بالمجال المكاني تعتمد على خرائط بروز التعلم العميق، تحقق في وقت واحد تحديد المجال المكاني وتحديد الجينات المتغيرة المكانية المقابلة، ومن المتوقع أن توفر طريقة فعالة للتحليل الدقيق لبيانات النسخ المكاني. * بالتعاون مع فريق يانغ يونغوي وكاي جون من معهد بكين لعلم الجينوم التابع للأكاديمية الصينية للعلوم (المركز الوطني للمعلومات الحيوية)، قمنا برسم خريطة النسخ المكانية ثلاثية الأبعاد STAPR لدودة البحر الأبيض المتوسط أثناء التجديد وحددنا بشكل منهجي العديد من العوامل التنظيمية الرئيسية للتجديد.

بيانات النسخ المكانية المحسنة من ENGEP

قامت مجموعة البحث التابعة للبروفيسور تشانغ شياوفي في كلية الرياضيات والإحصاء بجامعة وسط الصين العادية بتطوير طريقة حسابية تسمى ENGEP.باستخدام الانحدار المرجح لـ k-nearest-neighbor واستراتيجيات التعلم الجماعي، تمكنا من التنبؤ بدقة بتعبير الجينات غير المقاسة في النسخ المكاني. بالإضافة إلى ذلك، يمكن لـ ENGEP التنبؤ بدقة بأنماط التعبير للجينات غير المقاسة مكانيًا، وهو أمر ذو أهمية كبيرة لتعزيز بيانات النسخ المكانية.

ليس هناك شك في أن تمكين الذكاء الاصطناعي في مجال النسخ المكاني وحتى علم الأحياء لم يحسن كفاءة البحث فحسب، بل قدم أيضًا حلولاً جديدة لصعوبات البحث العلمي. وكما أشير إليه في قسم المناقشة في الورقة البحثية، فإن القيمة التي يجلبها بيانو هي أنه قد يحل محل التعليقات اليدوية التي تتطلب عمالة مكثفة ويوفر أشكالاً فعالة ودقيقة ومنخفضة التكلفة بطريقة آلية لإحداث تغييرات في النسخ المكاني وتعزيز التطورات الجديدة في علم الأحياء.

مراجع:
1. https://news.fudan.edu.cn/2024/0407/c2474a139894/page.htm
2. https://bfse.cas.cn/sxyqyjc/kyjz/202311/t20231110_4985132.html
3. https://kjc.ccnu.edu.cn/info/1009/3744.htm