HyperAI

مجموعة بيانات التحليل الطيفي الكيميائي متعدد الوسائط

التاريخ

منذ 6 أشهر

الحجم

9.7 GB

المؤسسة

رابط النشر

rxn4chemistry.github.io

* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.

تم إنشاء Multimodal Spectroscopy (Chemical Multimodal Spectroscopy) في عام 2024 بواسطة فريق بحثي من IBM Research وجامعة زيورخ و EPFL و NCCR Catalysis. "نتائج الورقة ذات الصلة هي"كشف البنية الجزيئية: مجموعة بيانات طيفية متعددة الوسائط للكيمياء"، والتي تم قبولها من قبل NeurIPS.

تحتوي مجموعة البيانات على بيانات محاكاة 1H-NMR و13C-NMR وHSQC-NMR والأشعة تحت الحمراء ولطيف الكتلة (الأنماط الأيونية الموجبة والسالبة) لـ 790.000 جزيء مستخرج من التفاعلات الكيميائية في بيانات براءات الاختراع. تكمن القيمة الأساسية لهذه المجموعة من البيانات في قدرتها على دمج المعلومات من الوسائط الطيفية المتعددة ومحاكاة الأساليب التي يستخدمها الخبراء البشريون لتحليل الهياكل الجزيئية، وبالتالي أتمتة التحليل البنيوي وتبسيط عملية الاكتشاف الجزيئي من التركيب إلى تحديد البنية.

تم إنشاء مجموعة البيانات مع الأخذ في الاعتبار التكامل بين التقنيات الطيفية المختلفة، مثل الرنين المغناطيسي النووي (NMR)، والتحليل الطيفي بالأشعة تحت الحمراء، وقياس الطيف الكتلي، والتي يمكن أن توفر رؤى مختلفة في البنية الجزيئية، بما في ذلك وجود أو عدم وجود مجموعات وظيفية. ومن خلال الجمع بين هذه المعلومات، يمكن للباحثين اكتساب فهم أعمق، وهو أمر بالغ الأهمية لتطوير نماذج الذكاء الاصطناعي/التعلم الآلي التي يمكنها دمج المعلومات من الوسائط الطيفية المتعددة.

بالإضافة إلى ذلك، توفر مجموعة بيانات التحليل الطيفي متعدد الوسائط أيضًا معيارًا لتقييم مهام الوسائط الفردية مثل توضيح البنية، والتنبؤ الطيفي للجزيئات المستهدفة، والتنبؤ بالمجموعة الوظيفية. لا تساعد هذه المعايير في تقييم أداء النماذج فحسب، بل توفر أيضًا توجيهات واضحة للأبحاث المستقبلية.

نظرة عامة على البيانات

multimodal_spectroscopic_dataset.torrent
البذر 1التنزيل 1مكتمل 61إجمالي التنزيلات 87
  • multimodal_spectroscopic_dataset/
    • README.md
      2.13 KB
    • README.txt
      4.27 KB
      • data/
        • multimodal_spectroscopic_dataset.zip
          9.7 GB