Command Palette
Search for a command to run...
سرطان الثدي: مجموعة بيانات الدمج متعددة الوسائط
التاريخ
عنوان URL للنشر
الترخيص
CC BY 4.0
سرطان الثدي: دمج البيانات متعددة الوسائط هو مجموعة بيانات متعددة الوسائط مُعالجة مسبقًا، مصممة خصيصًا لمرضى سرطان الثدي الغازي. يهدف هذا المشروع إلى توفير أساس جاهز للاستخدام لبناء شبكات دمج البيانات متعددة الوسائط، ويُستخدم على نطاق واسع في سيناريوهات بحثية مثل نمذجة دمج البيانات متعددة الوسائط، وعلم الأشعة، والتنبؤ بالبقاء على قيد الحياة، وتحليل العلاج الشخصي. تُنسق هذه المجموعة من البيانات بدقة بيانات متعددة المصادر من 122 مريضًا مصابًا بطفرة جينية في جين BRCA. رُسمت جميع العينات عبر مختلف تقنيات التصوير باستخدام معرّفات حالات TCGA، مما حقق تطابقًا تامًا بين التصوير الطبي الكلي (التصوير بالرنين المغناطيسي)، وعلم الأمراض الرقمي المجهري (علم الأنسجة المرضية)، وبيانات علم الجينوم المتعدد، ومعلومات العلاج السريري. تُنظم البيانات في شكل ملفات CSV، وصور رقع الأنسجة المرضية، وملفات الربط.
تكوين البيانات
نمط الرؤية
- فحص التصوير بالرنين المغناطيسي (mri_processed): صور الرنين المغناطيسي للثدي المعالجة مسبقًا والتي تستخدم لدراسة بنية الورم وخصائص التصوير.
- الشرائح النسيجية المرضية (SVS_patches): رقع شرائح مرضية عالية الدقة مستخرجة من صور الشرائح الكاملة (WSIs)، والتي يمكن استخدامها مباشرة لتدريب النماذج المرئية مثل CNN و Vit.
- يتم استخدام ملف تخطيط الأنسجة (MRI_and_SVS_Patches_index.json) لإنشاء علاقة التخطيط بين الرقع المرضية والمرضى، مما يسهل بناء أدوات تحميل البيانات PyTorch أو TensorFlow. علم الجينوم المتعدد
- بيانات التعبير الجيني (RNA_RAW.csv): بيانات التعبير الجيني الموحدة بتقنية تسلسل الحمض النووي الريبوزي (RNA-Seq).
- متغيرات عدد النسخ (CNV_RAW.csv): خصائص التضخيم والحذف لمتغيرات عدد النسخ (CNVs)
- ميزات الاندماج الأوميكس (RNA_CNV_ModelReady.csv): ملف ميزات موحد يحتوي على بيانات RNA و CNV، والتي يمكن استخدامها مباشرة كمدخلات لشبكة عصبية.
- بيانات الطفرات الجسدية (Mutations_Dataset.csv): قائمة بالجينات الجسدية المتحولة مجمعة حسب المريض. البيانات السريرية والعلاجية
- بيانات العلاج السريري (Clinical_Treatment_Data.csv): ملف بيانات سريرية وعلاجية مُنقّح
- تشمل المجالات السريرية المعلومات الديموغرافية، وحالة البقاء على قيد الحياة (vital_status)، والمرحلة المرضية TNM.
- مصفوفة ترميز الأدوية: توفر ميزات ترميز أحادية ساخنة للأدوية مثل Drug_Tamoxifen و Drug_Paclitaxel، المستخدمة لتحليل الارتباط بين أنظمة العلاج وتوقعات المرضى.
الاستشهاد
مجموعة بيانات أطلس جينوم السرطان لسرطان الثدي الغازي (TCGA-BRCA). البيانات الجينومية والسريرية المسترجعة من بوابة بيانات GDC التابعة لمشروع TCGA-BRCA
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.