HyperAI

الذكاء الاصطناعي مع الأجنة؟ يستخدم عالم الأحياء النظمية باتريك مولر شبكات توأم لدراسة أجنة سمك الزرد

منذ عام واحد
معلومة
JunZ
特色图像

باستخدام مجموعة بيانات مكونة من 3 ملايين صورة و15000 جنين سمك الزرد، نجح عالم الأحياء النظمي باتريك مولر في تنفيذ التعرف على الأجنة المستند إلى الذكاء الاصطناعي.

المؤلف|جيا لينغ

المحرر|سانيانغ

أثناء نمو الحيوان، تخضع الأجنة لتغيرات مورفولوجية معقدة بمرور الوقت. ويأمل الباحثون أن يتمكنوا من تحديد وقت وسرعة التطور بشكل موضوعي، وتوفير أساليب موحدة لتحليل مراحل الأجنة المبكرة وفهم العمليات التطورية والتنموية بشكل أفضل.

في السابق، كان فهم العلماء لمراحل النمو الجنيني والتحولات المورفولوجية الجنينية يأتي من الملاحظات المجهرية. ومع ذلك، فإن مرحلة الانتقال في التطور الجنيني ليست مثالية أو مستقرة. هناك العديد من العوامل المؤثرة مما يجعل من الصعب على الباحثين ملاحظة حالة نمو محددة. إن عملية مراقبة شكل الجنين لاستنتاج وقت ومرحلة النمو ما زالت ذاتية نسبيا.

من أجل تحديد العلاقة بين وقت التطوير وسرعة التطوير بشكل موضوعي،عالم الأحياء الأنظمة باتريك مولر قام باحثون بارزون في جامعة كونستانس بتطوير أسلوب تعلم عميق يعتمد على شبكة توأم يمكنها التقاط عملية التطور الجنيني تلقائيًا من خلال مقارنة الصور وتحديد المراحل المميزة للتطور الجنيني دون تدخل بشري.. وفي الوقت الحاضر، تم نشر النتائج ذات الصلة فيطرق الطبيعة".

نُشرت الورقة في مجلة Nature Methods

احصل على الورقة:

https://www.nature.com/articles/s41592-023-02083-8

01 الإجراءات التجريبية

مجموعة البيانات: دمج عدد كبير من صور الأجنة

باستخدام خط أنابيب التصوير عالي الإنتاجية وتجزئة الصور استنادًا إلى ResNet101،قام الباحثون بإنشاء مجموعة بيانات مكونة من 3 ملايين صورة و15 ألف جنين من أسماك الزرد.، لتوليد مسارات النمو للأجنة الفردية. يتم تتبع كل جنين على حدة ويتم تحديده بواسطة مربع محدد بلون مختلف عند إدخاله إلى النموذج. تم إنشاء ملف JSON منفصل لكل تجربة، يحتوي على معلومات حول الأجنة التي تنتمي إلى كل فئة.

مخطط معالجة الصور

هندسة النموذج: نموذج الشبكة السيامية

يتكون هيكل الشبكة التوأم من شبكتين عصبيتين متوازيتين لهما نفس الهيكل.، يمكن استقبال صورتين كمدخلات في نفس الوقت، ويتم تقاسم الأوزان بين الشبكتين العصبيتين. يتم مقارنة الصور من خلال حساب التشابه استنادًا إلى تضمين الميزة.

فيما يلي رسم تخطيطي لهيكل الشبكة التوأم:

بنية الشبكة التوأم

إن بنية الشبكة العصبية التي تشكل الشبكة التوأمية هي كما يلي:

الشبكة العصبية القائمة على ResNet50

الشبكة الأساسية:مرتكز على شبكة إيماج نت  مجموعة البيانات، هندسة ResNet50 مع الأوزان المدربة مسبقًا كشبكة أساسية؛

تضمين رأس النموذج:يتم تسوية مخرجات شبكة العمود الفقري وتمريرها إلى رأس نموذج التضمين، والذي يتكون من ثلاث طبقات كثيفة مع طبقات تطبيع الدفعات بين كل طبقة، مما ينتج عنه مخرجات/تضمين بحجم (1، 256)؛

نقل التعلم:تم تجميد جميع طبقات شبكة العمود الفقري ResNet50 باستثناء الكتلة التلافيفية 5 وطبقة رأس النموذج. يتم دمج تضمينات الميزات التي تم إنشاؤها بواسطة ResNet50 في طبقة المسافة لحساب المقياس الإقليدي بين التضمينات التي تم إنشاؤها بواسطة الشبكة لمدخلات مختلفة أثناء التدريب.

تدريب الخوارزمية: تدريب الخسارة الثلاثية

تتم عملية تدريب الخوارزمية على النحو التالي:

بناء ثلاثيات الصور:تتكون الصور الثلاثية من ثلاث صور أجنة، وهيصورة المرساة، صور الأجنة في مرحلة النمو العشوائية t1؛صورة إيجابية، على غرار الصورة في مرحلة التطوير t1 (شبكة الإدخال العصبية 1) أو صورة المرساة بعد تحسين الصورة (شبكة الإدخال العصبية 2)؛صورة سلبية، صور الأجنة في مرحلة النمو t2 ≠ t1.

مخطط الصورة الثلاثية

تدريب فقدان الثلاثي:قم بتمرير الثلاثية للصورة المبنية إلى الشبكة السيامية واحسب خسارة الثلاثية بناءً على الصيغة أدناه لتقليل التشابه بين صورة المرساة والصورة الإيجابية وتعظيم التشابه بين صورة المرساة والصورة السلبية.

صيغة حساب الخسارة الثلاثية

يمثل A صورة المرساة، ويمثل P الصورة الإيجابية، ويمثل N الصورة السلبية.

التدريب التكراري:تم تدريب الشبكة العصبية 1 لمدة 10 عصور باستخدام 300000 صورة ثلاثية لأجنة سمكة الزرد؛ تم تدريب الشبكة العصبية 2 لمدة 2 عصر باستخدام مليون ثلاثية صور، وتم تحسين صور المرساة باستخدام NVIDIA GeForce RTX3070 (ASUS) للتدريب المعجل بواسطة وحدة معالجة الرسومات.

التدريب القائم على المهام:تم إجراء تدريب مماثل على تشابه الصور، والمرحلة الجنينية، وسرعة التطور ودرجة الحرارة، والتغيرات في التطور الجنيني الناجمة عن الأدوية.

02 النتائج التجريبية

النتيجة 1: تحديد مرحلة الجنين تلقائيًا باستخدام الرسوم البيانية المتشابهة

يتم مقارنة صورة الاختبار بمجموعة من صور الأجنة، ويتم حساب التشابه الجيبي بينهما، ويتم الحصول على درجة التشابه لتصنيف صور الأجنة.

رسم بياني للتشابه بين أجنة الاختبار والصور المرجعية

من خلال مقارنة صورة الاختبار مع السلسلة الزمنية لصور الجنين النامي، نحصل على منحنى التشابه بمرور الوقت، والذي نستخرج منه ميزتين رئيسيتين:

·  يشير ذروة المنحنى إلى المرحلة التنموية التي يتواجد فيها الجنين في صورة الاختبار.

· تحتوي المناطق غير الذروة للمنحنيات على معلومات إضافية، مثل عرض الذروة والتشابه مع المراحل الجنينية البعيدة، مما يعكس أوجه التشابه الشكلية في نقاط زمنية مختلفة.

مخطط تخطيطي للتنبؤ بعمر الجنين

يمكن للشبكة التوأمية تحديد وتوقع مجموعة من الصور المتسلسلة الزمنية للجنين، وبناء مسار يعتمد على مرحلة النمو المتوقعة، وتحقيق مرحلة دقيقة للجنين..

النتيجة 2: استكشاف العلاقة الوظيفية بين سرعة التطور ودرجة الحرارة

في السابق، كان تحديد اعتماد التطور الجنيني على درجة الحرارة يتطلب شرحًا يدويًا أو شبه آلي لتوقيت التطور، وهو ما كان يحد بشكل كبير من عدد التجارب التي يمكن تحليلها ضمن فترة زمنية معقولة.

تم استخدام الشبكة التوأمية المبنية لتحليل التغيرات المعتمدة على درجة الحرارة في معدل النمو بشكل تلقائي. كانت الخطة التجريبية هي: أجنة سمك الزرد بين 23.5 درجة مئوية و35.5 درجة مئوية وأجنة سمك الشبوط الأسود بين 18 درجة مئوية و36 درجة مئوية. تم تحليل 100 إلى 200 جنين من أسماك الزرد أو 20 إلى 100 جنين من أسماك الشبوط السوداء في ظل كل ظروف درجة الحرارة.

وتظهر النتائج التجريبية في الشكل:

تحليل التطور الجنيني لسمك الزرد والكارب الأسود في درجات حرارة مختلفة

أ، د: مخطط تخطيطي لتقدير عمر سمك الزرد والكارب الأسود؛

ب، هـ: تطور سمك الزرد والكارب الأسود في درجات حرارة مختلفة؛

ج، و: اللوغاريتم الطبيعي لمعدل النمو المقدر لسمك الزرد والكارب الأسود في درجات حرارة مختلفة.

· وكان لتغيرات درجات الحرارة تأثير كبير على معدلات نمو الجنينين.في درجات الحرارة المنخفضة، يكون التطور الجنيني أبطأ، في حين أن درجات الحرارة المرتفعة تسبب تسارع التطور بشكل كبير. وعند مواجهة تغير في درجة الحرارة قدره 10 درجات مئوية، تغير معدل النمو بنحو الضعف.

·  تم تحديد كمية اعتماد معدلات النمو على درجة الحرارة باستخدام شبكة توأم، وتم تجهيز البيانات بمعادلة أرهينيوس. يعطي ميل الملاءمة الخطيةطاقة التنشيط الظاهرةوهما 65 كيلوجول/مول و77 كيلوجول/مول على التوالي. هذه الطاقات التنشيطية الظاهرة وغيرهامتغير الحرارةعلى غرار الحيوانات ذوات الدم الحار (مثل الضفادع، أو ذباب الفاكهة، أو الخميرة)، فإنه يختلف بشكل واضح عن الحيوانات ذوات الدم الحار (مثل الفئران أو البشر).

·  وعلى عكس التكهنات المثالية، فإن معدلات نمو الجنينين في المناطق ذات درجات الحرارة الأعلى لم تعد تتسارع، بل تميل إلى الاستقرار. في المناطق ذات درجات الحرارة المنخفضة: يتباطأ نمو سمك الزرد بشكل خطي، ويتوقف نمو الجنين عندما تنخفض درجة الحرارة إلى أقل من 23 درجة مئوية؛ تظهر أجنة سمك الشبوط الأسود خصائص التطور غير الخطي، حيث تبقى راكدة في مرحلة الكيس البدائي من التطور لفترة طويلة.

النتيجة 3: تحديد كمية التباين الطبيعي أثناء التطور الجنيني

وتوصلت الدراسة إلى أنه على الرغم من تأثر الأجنة بالاختلافات الجينية والتدخلات الخارجية والضوضاء والعشوائية في التعبير الجيني، مما يؤدي إلى انحرافات في معدل النمو ومرحلة التطور، إلا أن العملية التطورية ستكتمل دائمًا.

رسم بياني للاختلافات التطورية في الأجنة

تم استخدام شبكة التوأم لتقييم الاختلافات في النمط الظاهري الفردي بين الأجنة في نفس العمر. وتظهر النتائج التجريبية في الشكل:

مخطط التطور الجنيني

تُظهر اللوحة اليسرى النسبة المئوية لمراحل النمو الجنيني المتوقعة بعد أوقات مختلفة، 0 دقيقة (أخضر)، و400 دقيقة (أزرق)، و800 دقيقة (أرجواني)؛

يوضح الرسم البياني الأيمن أن متوسط قيمة التشابه بين الأجنة انخفض بمرور الوقت.

في مرحلة التطور الجنيني المبكر، تكون المراحل الجنينية المتوقعة ذات توزيع ضيق، بينما مع بداية فترة التجزئة، يزداد عرض توزيع المراحل الجنينية المتوقعة. وهذا يدل على أنأثناء التطور الجيني، تتزايد الاختلافات بين الأفراد تدريجيًا، لكن قيمة التشابه المتوسطة تنخفض بمرور الوقت.

من بين أكثر من 3 ملايين صورة لأجنة سمك الزرد، أظهرت حوالي 1% نموًا غير طبيعي، حيث كان الانهيار التلقائي أو عيوب القطبية الظهرية البطنية من الأسباب الشائعة.باستخدام الشبكات التوأمية، يتمكن الباحثون من اكتشاف الأجنة التي تعاني من تشوهات نمو في مرحلة مبكرة. أظهرت هذه الأجنة غير الطبيعية قيم تشابه متوسطة منخفضة خارج نطاق التطور الطبيعي المتوقع.

توضيح لتطور الجنين غير الطبيعي

النتائج 4: تحديد النمط الظاهري للأجنة المعالجة بالأدوية

يتم تنسيق التطور الجنيني من خلال جزيئات إشارات متعددة، وتعديل نشاطها قد يؤدي إلى تغييرات في النمط الظاهري للجنين. أثناء نمو سمكة الزيبرا، هناك سبعة مسارات رئيسية للإشارة. من بين هذه المسارات، ينظم بروتين تكوين العظام (BMP)، وحمض الريتينويك (RA)، وWnt، وعامل نمو الخلايا الليفية (FGF)، ومسارات إشارات العقد بشكل أساسي اتجاه الطبقة الجرثومية وتكوين المحور الظهري البطني الأمامي الخلفي، بينما تتحكم مسارات إشارات Sonic Hedgehog (Shh) واستقطاب الخلايا المستوية (PCP) في امتداد وتكوين محور الجسم.

وقد قام الباحثون باختبار فعالية شبكة التوائم في الكشف عن الأجنة غير الطبيعية، وتظهر النتائج في الشكل أدناه:

مقارنة نمطية بين الأجنة غير المعالجة والأجنة المعالجة بالأدوية

أ: تم استخدام الأجنة غير المعالجة كمرجع للنمط الظاهري للأجنة المعالجة بالدواء؛

ب-أ: التغيرات في التشابه بين الأجنة المعالجة بأدوية مختلفة والأجنة غير المعالجة؛

ج: اعتماد عدد الأجنة على دقة الكشف عن الشذوذ.

أظهرت مقارنة النمط الظاهري للأجنة غير المعالجة مع تلك المعالجة بمثبطات BMP وNodal وFGF وShh وPCP وWnt والأجنة المعرضة لـ RA قيم تشابه عالية بين الأجنة غير المعالجة، في حين كانت قيم التشابه بين الأجنة المعالجة بأدوية الجزيئات الصغيرة والأجنة غير المعالجة منخفضة بشكل عام.

يتم إجراء التحليل الإحصائي لنقاط الوقت لتحديد نقاط الوقت التي ينحرف فيها تعداد الأجنة بشكل كبير عن تعداد السكان المرجعي، وبالتالي الكشف عن تعداد الأجنة التي تعاني من عيوب ظاهرية. تعتمد دقة الكشف على عدد الأجنة التي تم تحليلها ونوع التداخل.

أيضًا،كما استكشفت الدراسة مدى دقة الطريقة في تحديد النمط الظاهري لمعدلات الاختراق والشدة المختلفة.يظهر في الشكل النطاق المعروف للأنماط الظاهرية في أجنة سمك الزرد الناجمة عن مستويات مختلفة من تثبيط مسار BMP: يمكن للشبكة التوأم اكتشاف الانحرافات التنموية بدقة. بالنسبة للأنماط الظاهرية ذات الاختراق العالي أو الأنماط الظاهرية الواضحة الناجمة عن جرعات عالية من مثبطات مسار إشارات BMP ذات الجزيئات الصغيرة، هناك حاجة إلى عدد صغير فقط من الأجنة للكشف الدقيق، في حين تتطلب الأنماط الظاهرية الخفيفة حوالي 30 جنينًا.

التغيرات الظاهرية لأجنة سمك الزرد تحت مستويات مختلفة من تثبيط مسار BMP

وتظهر هذه التحليلات أنالشبكة السيامية، التي تم تدريبها فقط باستخدام صور الأجنة النامية بشكل طبيعي، قادرة على اكتشاف التغيرات الظاهرية الجنينية بطريقة غير متحيزة..

النتيجة 5: الاشتقاق التلقائي لفترة التطور الجنيني

عادةً، تتوفر صور مرجعية للأجنة لتقييم توقيت نمو الأجنة الاختبارية، ولكن بالنسبة للأنواع المكتشفة حديثًا أو غير المحددة، فقد لا تكون مثل هذه الصور المرجعية متاحة.

يقترح الباحثون أنه من الممكن استخدام شبكة التوائم لتحديد مرحلة النمو من خلال حساب التشابه بين صورة الاختبار وصور أخرى لنفس الجنين في نقاط زمنية سابقة.

تظهر نتائج تحليل التشابه على أجنة سمك الزرد في الشكل:

اشتقاق فترة التطور الجنيني

أ: احسب التشابه بين الجنين الاختباري والصور من نقاط زمنية تم الحصول عليها مسبقًا لنفس الجنين؛

ب: مصفوفة التشابه التمثيلية.

في مراحل النمو المختلفة، تقدم أوجه التشابه خصائص توزيع فريدة. لقد لاحظوا نمطًا مشتركًا: قيم التشابه العالية متجمعة محليًا، بينما في نقاط زمنية أكثر بعدًا، كانت قيم التشابه أقل ومستقرة.

ومن المثير للاهتمام أن أوجه التشابه الإحصائية المحلية والعالمية بين أزواج الصور التي تم تقييمها بواسطة الشبكة السيامية كانت متسقة مع تسلسل المراحل الرئيسية أثناء التطوير. تتمتع الأجنة التي تقع في المرحلة الثابتة بمورفولوجيا مستقرة تسلط الضوء على فترات رئيسية في التطور، مثل مرحلة الانقسام الكلاسيكي، والكيسة الأريمية، والقرص الجنيني، وتكوين الأعضاء، ومرحلة التجزئة. في المقابل، تمثل الأجنة التي تقع على الحدود بين المراحل الثابتة فترة وجيزة تحدث خلالها تغيرات كبيرة في مورفولوجيا النمو.

ويحاول الباحثون الآن توسيع نطاق هذا النهج ليشمل أنواعًا أخرى، بما في ذلك سمك الميداكا والأسماك ذات الأشواك الثلاثة. وأظهرت النتائج أن الشبكة التوأمية أنتجت أطلسًا معلوماتيًا لهذه التسلسلات الجنينية المتنوعة مورفولوجياً.

الكشف التلقائي عن مراحل النمو والانتقالات في أجنة سمك الشبوط الأسود والأسماك ذات الأشواك الثلاثة

وفي أبحاث أخرى، قاموا بتطبيق هذه الطريقة على الدودة الخيطية Caenorhabditis elegans ذات الصلة البعيدة. استخدم الباحثون بيانات مفتوحة من مصادر مستقلة مختلفة، مثل الأوراق المنشورة ومقاطع الفيديو على موقع يوتيوب، لتدريب الشبكة وتقييمها، وتمكنوا بنجاح من التعرف تلقائيًا على دورة الانقسام الأولى لـ C. elegans، مما أدى إلى تشكيل أول أربع خلايا جنينية.

وتشير هذه النتائج إلى أنيمكن استخدام نهج الشبكة التوأمية لإنشاء خرائط تنموية تلقائية لأنواع مختلفة لأنظمة بيولوجية مختلفة ومجموعة واسعة من مجموعات بيانات الصور، دون الحاجة إلى نماذج تم تدريبها مسبقًا خصيصًا لهذا الغرض..

03 الشبكة التوأمية مقابل الشبكة التوأمية الرقمية

في عصر الجيل الخامس، تم ذكر شبكات التوأم الرقمية بشكل متكرر. وفي الوقت نفسه، تظهر أيضًا "تكنولوجيا التوأم" التي تحمل اسمًا مشابهًا - شبكة التوأم - في مجال التعرف على الصور. وعلى الرغم من أن المفهومين مختلفان، إلا أنهما أظهرا تآزرا في مجالات معينة.

أولاً، يرجى ملاحظة أن هذين مفهومان مختلفان تمامًا.

شبكة التوأم:هندسة التعلم العميق التي تستخدم بشكل أساسي في استرجاع الصور ومطابقة الصور وتصنيف الصور وغيرها من المجالات. يقوم بمقارنة وتحليل تشابه الصور من خلال تعلم التمثيل المضمن للصور.

شبكة التوأم الرقمي:نموذج افتراضي لكيان مادي يتفاعل مع كيانه المادي المقابل من خلال تحديثات البيانات في الوقت الفعلي وتقنية المحاكاة، ويمكنه محاكاة سلوك وأداء الكيان المادي في ظل ظروف مختلفة. يتم استخدامه بشكل أساسي في التصنيع الصناعي، وإنترنت الأشياء، والتخطيط الحضري، والفضاء الجوي وغيرها من المجالات.

باعتبارها خوارزمية للذكاء الاصطناعي، يمكن لشبكة Twin Network الاستفادة من مزاياها الخاصة لتمكين وتحسين كفاءة شبكات التوأم الرقمية.

على سبيل المثال، في التوأم الرقمي للمعدات الصناعية، تستطيع شبكة التوأم مقارنة صور المعدات في نقاط زمنية مختلفة لفهم التغييرات والاختلافات في حالة المعدات؛ في تخطيط المدن التوأمية الرقمية، يمكن لشبكة التوأم معالجة بيانات الصور الملتقطة بواسطة مجسات المراقبة، وإجراء مراقبة ومحاكاة في الوقت الفعلي لتدفق حركة المرور وظروف الطرق، وما إلى ذلك.

باختصار، توفر Twin Network الدعم والتطبيقات المتعلقة بالصور لشبكة التوأم الرقمية من خلال الجمع بين بيانات الصور وتقنية التعلم العميق، وبالتالي تحسين قدرات الاستحواذ على المعلومات والمراقبة واتخاذ القرار للتوائم الرقمية.

ولا يقتصر الأمر على شبكة Twin Network فحسب، بل ستعمل أدوات الذكاء الاصطناعي الأخرى أيضًا على تمكين التوائم الرقمية بشكل أكبر.