HyperAI

OBIA: أكثر من 900 مريض، وأكثر من 193 صورة، أصدر معهد الأكاديمية الصينية للعلوم الجينومي أول قاعدة بيانات لمشاركة الصور البيولوجية في بلدي

منذ 2 أعوام
معلومة
Yuanyuan Feng
特色图像

من الشائع رؤية الطبيب والتقاط الأشعة السينية. يمكن نقل بيانات التصوير المقطعي المحوسب والتصوير بالرنين المغناطيسي والأشعة السينية وغيرها من البيانات التصويرية عبر جسم الإنسان بطريقة غير جراحية، مما يجعل حالة الأعضاء والأنسجة الداخلية مرئية بوضوح، مما يوفر أساسًا موثوقًا به للتشخيص السريري وعلاج المرض.

مع التطور الواسع النطاق لتكنولوجيا التصوير الطبي، أصبحت بيانات التصوير تمثل أكثر من 80% من البيانات الطبية المحلية.أصبحت نقاط الألم مثل نقص أخصائي الأشعة، والاختلافات في نتائج التشخيص بين المستشفيات على جميع المستويات، والتوزيع غير المتكافئ للموارد الطبية بارزة بشكل متزايد.

هناك مجال كبير للخيال عند الجمع بين الذكاء الاصطناعي والتصوير الطبي. تتمتع تقنيات الإدراك الحسي والتعلم العميق بمزايا لا مثيل لها مقارنة بالبشر في تحديد نتائج تشخيص التصوير الطبي. يمكنهم مساعدة الأطباء على تقليل معدلات التشخيص الخاطئ وتحسين كفاءة العمل.

لكن،تتطلب خوارزميات الذكاء الاصطناعي عالية الجودة مجموعات بيانات صور كبيرة وتمثيلية بدرجة كافية.غالبًا ما تتضمن هذه الصور الطبية قدرًا كبيرًا من معلومات الخصوصية الحساسة. بالإضافة إلى ذلك، هناك "جزر بيانات" بين المستشفيات على جميع المستويات، ونظام المشاركة غير المكتمل يجعل الموارد المتاحة للذكاء الاصطناعي في مجال التصوير الطبي محدودة.

المؤلف | برج

المحرر | سانيانغ، شيويه تساي

لقد قامت العديد من البلدان حول العالم ببناء قواعد بيانات مختلفة لتبادل بيانات التصوير الطبي. ولا تزال بلادي متأخرة عن المجتمع الدولي في هذا المجال. من أجل تعزيز تبادل بيانات التصوير البيولوجي الطبي عالية الجودة،أنشأ معهد الجينوميات التابع للأكاديمية الصينية للعلوم (المركز الوطني للمعلومات الحيوية، الصين) أرشيف التصوير الطبي الحيوي المفتوح (OBIA).

باعتبارها أول مستودع مفتوح لبيانات التصوير الطبي الحيوي والبيانات السريرية ذات الصلة في الصين،يعد برنامج OBIA مفتوحًا للممارسين الطبيين والعلماء في جميع أنحاء العالم مجانًا. تم نشر النسخة الأولية للنتائج ذات الصلة على "bioRxiv" في 25 سبتمبر 2023.

رابط الورقة:https://www.nature.com/articles/s42256-023-00704-7

اتبع الحساب العام "HyperAI Super Neural" ورد "OBIA" للحصول على ملف PDF الكامل للورقة البحثية

عملية إنشاء قاعدة بيانات OBIA وتنفيذها

باعتبارها مورد قاعدة البيانات الأساسية للمركز الوطني الصيني للمعلومات الحيوية، تقبل OBIA إرسال الصور من جميع أنحاء العالم وتوفر وصولاً مفتوحًا مجانيًا إلى جميع البيانات العامة.ويدعم إزالة التعريف عن بيانات الصورة وإدارتها ومراقبة جودتها.إن توفير خدمات البيانات مثل التصفح والاسترجاع والتنزيل يمكن أن يعزز إعادة استخدام بيانات الصور والبيانات السريرية الموجودة.

يستخدم OBIA خمسة أنواع من كائنات البيانات (المجموعة، الفرد، الدراسة، السلسلة، الصورة) لتنظيم البيانات.تقبل إرسال صور طبية حيوية متعددة الوسائط، ومتعددة الأعضاء، ومتعددة الأمراض.

لحماية خصوصيتك،لقد طورت OBIA عملية موحدة لإلغاء التعريف ومراقبة الجودة.كما أنه يوفر واجهة ويب سهلة الاستخدام وبديهية لإرسال البيانات وتصفحها واسترجاعها، بالإضافة إلى استرجاع الصور. بشكل عام، يوفر OBIA منصة موثوقة لإدارة بيانات التصوير الطبي الحيوي المحلية، مما يساعد في دعم الأبحاث الطبية الحيوية العالمية.

الشكل 1: واجهة الوصول OBIA

زيارة الرابط:https://ngdc.cncb.ac.cn/obia

تفاصيل التنفيذ——استرجاع الصور

تتمتع الشبكات العصبية العميقة بالقدرة على استخراج الميزات المفيدة.يمكن استخدامه لاسترجاع صور طبية متعددة الوسائط لأعضاء مختلفة من جسم الإنسان وتحسين أداء التصنيف في حالات العينة الصغيرة. بالمقارنة مع الطرق التقليدية، فإن الطرق القائمة على التعلم العميق مثل تحويل الميزة الثابتة على المقياس (SIFT)، والأنماط الثنائية المحلية (LBP)، والرسم البياني للمنحدرات الموجهة (HOG) يمكن أن تظهر أداءً أفضل.

في OBIA، استخدم الباحثون EfficientNet كمستخرج للميزات استنادًا إلى بيانات السرطان المتعددة الوسائط من قاعدة بيانات تصوير السرطان TCIA، وقاموا بتدريب النموذج باستخدام شبكة ثلاثية ووحدة انتباه، وضغطوا الصورة إلى قيم تجزئة منفصلة (الشكل 2). بعد ذلك، لتسريع أداء الاستدلال وتقليل زمن انتقال الاستدلال، يتم تحويل النموذج المدرب إلى تنسيق TensorRT ويتم استخدام Faiss لتخزين رموز التجزئة.

استخدم الباحثون مسافة هامينج لحساب تشابه الصورة وأعادوا الصورة الأكثر تشابهًا.تظهر النتائج أن قيمة متوسط الدقة المتوسطة (MAP) للنموذج المقترح تتجاوز أداء نماذج استرجاع الصور المتقدمة الموجودة على مجموعة بيانات TCIA.

الشكل 2: التجزئة الثلاثية العميقة استنادًا إلى وحدات الانتباه ودمج الطبقات

يستخدم هذا النموذج EfficientNet-B6 كشبكة رئيسية ويستخدم وحدة الاهتمام CBAM في Block5 للحصول على خرائط الميزات. يتم اعتماد دمج الطبقات في الطبقات المتصلة بالكامل لتوليد أكواد التجزئة وتضمينات الفئة باستخدام فقدان البؤرة وفقدان الثلاثي.

ملحوظة:

● CBAM: وحدة انتباه الكتلة التلافيفية

● EfficientNet: نوع جديد من شبكات CNN اقترحته Google في عام 2019، والذي يتميز بكفاءة عالية للغاية في المعلمات وسرعة عالية ويعمل بشكل جيد في مجال تصنيف الصور

● Faiss: مكتبة بحث تشابه عالية الأداء تم تطويرها بواسطة Facebook AI Research، وتستخدم بشكل شائع في التعلم العميق

محتوى قاعدة البيانات واستخدامها - نموذج البيانات

كما هو موضح في الشكل 3،تنقسم بيانات التصوير في OBIA إلى خمسة أنواع من الكائنات:المجموعة، الفرد، الدراسة، السلسلة، الصورة، تشير على التوالي إلى:

• المجموعات:تم إضافة البادئة "OBIA" لتوفير وصف شامل للتقديم الكامل؛

• فردي:أرقام التسجيل مسبوقة بحرف "I" وتحدد خصائص الكائن البشري أو غير البشري الذي يتلقى أو مسجل لتلقي خدمات الرعاية الصحية؛

• يذاكر:رقم التسجيل يسبقه الحرف "S" ويحتوي على معلومات وصفية حول الفحص الإشعاعي للفرد؛

• مسلسل:يمكن تقسيم الدراسة إلى سلسلة واحدة أو أكثر وفقًا لمنطق مختلف (مثل جزء الجسم أو الاتجاه)؛

• صورة:يصف بيانات البكسل لملف DICOM واحد (التصوير الرقمي والاتصالات في الطب). ترتبط الصورة بسلسلة واحدة في دراسة واحدة.

ملاحظة: DICOM هو معيار دولي يستخدم على نطاق واسع في مجال التصوير الطبي. إنها تحدد مجموعة من المواصفات والبروتوكولات لتخزين ونقل ومشاركة وطباعة بيانات التصوير الطبي، بحيث تكون المعدات الطبية والبرامج التي تنتجها شركات مصنعة مختلفة متوافقة وتتواصل مع بعضها البعض.

الشكل 3: نموذج بيانات OBIA

بناءً على هذه الكائنات البيانات القياسية،يقوم OBIA بربط بنية الصورة المحددة بواسطة معيار DICOM بمشاريع البحث الفعلية.يتم تحقيق مشاركة البيانات وتبادلها.

بالإضافة إلى ذلك، يتم ربط كل مجموعة في OBIA بـ BioProject لتوفير بيانات وصفية حول مشروع البحث؛

عندما يكون ذلك متاحًا، يمكن ربط الفرد في OBIA عبر رقم الوصول الفردي بـ GSA-Human، والذي يربط بيانات التصوير بالبيانات الجينومية للباحثين لإجراء تحليلات متعددة الأوميكس.

رابط المشروع الحيوي:

https://ngdc.cncb.ac.cn/bioproject/

عنوان رابط GSA-Human:

https://ngdc.cncb.ac.cn/gsa-human/

محتوى قاعدة البيانات واستخدامها——إزالة الهوية ومراقبة الجودة

قد تحتوي الصور الطبية الحيوية على معلومات صحية محمية (PHI) ويجب معالجتها بشكل صحيح لتقليل مخاطر انتهاك الخصوصية الشخصية. من أجل الحفاظ على أكبر قدر ممكن من المعلومات العلمية القيمة أثناء حذف PHI،يوفر OBIA آلية لإلغاء التعريف ومراقبة الجودة تتوافق مع معيار DICOM (الشكل 4).

الشكل 4: آليات إزالة الهوية ومراقبة الجودة في OBIA

تستخدم OBIA معالج التجارب السريرية MIRC (CTP) التابع للجمعية الإشعاعية لأمريكا الشمالية (RSNA) لإجراء الكثير من أعمال إزالة التعريف:

• بالنسبة للعلامات القياسية،قام الباحثون ببناء CTP وتطوير برنامج نصي عالمي لإلغاء تحديد الهوية الأساسية لإزالة أو إخفاء هوية بعض العلامات القياسية التي تحتوي أو قد تحتوي على معلومات صحية محمية؛

• بالنسبة للعلامات الخاصة،استخدم PyDicom لمعالجته، مع الحفاظ على طبيعته الرقمية البحتة.

بعد اكتمال عملية إزالة الهوية، تبدأ OBIA في تنفيذ إجراءات مراقبة الجودة:

• الصورة المعنية:عزل الصور، حيث يمكن لمقدميها تقديم معلومات ذات صلة لإصلاح الصورة أو التخلص منها تمامًا (مثل هذه الصور هي تلك التي تحتوي على عناوين فارغة أو بطاقات هوية مفقودة للمرضى، أو تالفة، أو مختلطة مع صور أخرى للمرضى، وما إلى ذلك)؛

• صورة مكررة:احتفظ بواحدة فقط.

يقوم OBIA بعد ذلك بإنشاء تقرير لجميع الصور باستخدام TagSniffer حيث تتم مراجعة جميع عناصر DICOM بعناية للتأكد من أنها لا تحتوي على PHI وأن قيمًا معينة (على سبيل المثال، معرف المريض وتاريخ الدراسة) يتم تعديلها كما هو متوقع.

أيضًا،ويقوم موظفو OBIA أيضًا بإجراء عمليات تفتيش بصرية لبيكسلات الصورة.للتأكد من عدم تضمين أي معلومات صحية محمية في قيم البكسل وأن الصورة مرئية وغير تالفة.

محتوى قاعدة البيانات واستخدامها——إحصائيات

اعتبارًا من سبتمبر 2023، جمعت OBIA 937 "فردًا" و4136 "دراسة" و24701 "سلسلة" و1938309 "صورة"، تغطي 9 وسائط و30 جزءًا تشريحيًا.

تشمل وسائل التصوير التمثيلية التصوير المقطعي بالأشعة السينية (CT)، والرنين المغناطيسي (MR)، والتصوير الشعاعي الرقمي (DX)، وتشمل المواقع التشريحية البطن والصدر والصدر والرأس والكبد والحوض، وما إلى ذلك.

الدفعة الأولى من البيانات المرسلة إلى OBIA جاءت من مستشفى 301.تتضمن بيانات التصوير لثلاثة أورام نسائية رئيسية (سرطان بطانة الرحم، وسرطان المبيض، وسرطان عنق الرحم).

كما هو موضح في الجدول 1، يتم تقسيم هذه البيانات إلى أربع "مجموعات"، تسرد عدد "الأفراد"، وعدد "الدراسة"، وعدد "السلسلة"، وعدد "الصورة". أيضًا،يقوم OBIA أيضًا بجمع البيانات الوصفية السريرية ذات الصلة.مثل البيانات الديموغرافية والتاريخ الطبي والتاريخ العائلي والتشخيص ونوع المرض وطريقة العلاج.

الجدول 1: الدفعة الأولى من المعلومات المقدمة إلى OBIA

كسر حواجز البيانات،بناء منصات لتبادل البيانات الطبية محليًا ودوليًا

لن تولد البيانات أي قيمة إلا عندما يتم تداولها. من أجل تحسين مستوى تبادل بيانات التصوير البيولوجي،تلتزم العديد من البلدان حول العالم ببناء قواعد بيانات طبية مفتوحة:

• المعاهد الوطنية للصحة (NIH):رعاية العديد من قواعد المعرفة، مثل MIDRC، وهي منصة مفتوحة المصدر للصور والبيانات الطبية المتعلقة بـ COVID-19، وIDA وNITRC-IR وFITBIR وOpenNeuro وNDA، التي تجمع التصوير العصبي والدماغي، وقواعد بيانات تصوير السرطان TCIA وIDC (توفر TCIA الصور محليًا وتوفر IDC الصور في بيئة سحابية لمشاركة بيانات أبحاث السرطان)؛

• أبحاث السرطان في المملكة المتحدة:رعاية قاعدة بيانات صور تصوير الثدي بالأشعة السينية OPTIMAM (OMI-DB)؛

• جامعة بورتو، البرتغال:رعاية مستودع سرطان الثدي الرقمي (BCDR)، الذي يوفر صورًا توضيحية لسرطان الثدي وتفاصيل سريرية؛

في المستودعات المذكورة أعلاه، باستثناء NITRC-IR وIDC،وتدعم معظم البلدان الأخرى إزالة هوية البيانات ومراقبة الجودة.بالإضافة إلى ذلك، توفر بعض الجامعات أو المؤسسات أيضًا مجموعات بيانات مفتوحة المصدر، مثل OASIS، وEchoNet-Dynamic، ومشروع CAMUS، وما إلى ذلك.

الشكل 5: تصوير مقطعي محوسب للصدر لمريض يبلغ من العمر 79 عامًا في قاعدة بيانات MIDRC 

في البلاد،توفر جامعة هواتشونغ للعلوم والتكنولوجيا موارد مفتوحة لصور الأشعة المقطعية المتكاملة وCFs لـ COVID-19.ويشمل هذا البحث صور الأشعة المقطعية والخصائص السريرية للمرضى المصابين بالالتهاب الرئوي (بما في ذلك مرض كوفيد-19)، ولكنه يقتصر على مرض واحد والموارد البحثية المتاحة محدودة. ولذلك، لا يزال هناك نقص في قواعد البيانات في الصين المتخصصة في تخزين وقبول البيانات الخاصة بالأمراض المختلفة والوسيلة العلاجية.

OBIA الذي أنشأته الأكاديمية الصينية للعلوم يسد الفجوة في المشاركة المفتوحة لبيانات التصوير الطبي الحيوي المحلية، مما يسهل على الباحثين من مؤسسات مختلفة مشاركة بيانات التصوير ذات الصلة السريرية ويمكنه سد الفجوة في مجال قاعدة بيانات التصوير الطبي الحيوي في الصين بشكل فعال.

وذكر الباحثون في البحث أنهم سيواصلون تحديث البنية التحتية لـ OBIA وزيادة التدابير الأمنية في المستقبل. وسوف يقومون أيضًا بجمع المزيد من أنواع بيانات التصوير الطبي الحيوي وتوسيع مصادر البيانات.نحن نتخذ تدابير متعددة للتحرك نحو هدف "الاحتفاظ بأكبر قدر ممكن من بيانات الصور الصالحة وتوفير بيانات تصوير عالية الجودة للباحثين العلميين".

-- زيادة--