HyperAI

تعليمات مول مجموعة بيانات التعليمات الجزيئية الحيوية واسعة النطاق

*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.

Mol-Instructions عبارة عن مجموعة بيانات تعليمات جزيئية حيوية واسعة النطاق مصممة للنماذج اللغوية الكبيرة. تم إنشاؤه بواسطة فريق بحثي من جامعة تشجيانغ في عام 2024. نتائج الورقة ذات الصلة هي "تعليمات المول: مجموعة بيانات تعليمات جزيئية حيوية واسعة النطاق لنماذج اللغة الكبيرة"، تم قبولها من قبل ICLR 2024.

تحتوي مجموعة البيانات على ثلاثة أنواع من التعليمات: تعليمات موجهة للجزيئات، وتعليمات موجهة للبروتين، وتعليمات نصية للجزيئات الحيوية. ويهدف إلى توفير بيانات تعليمية غنية لتعزيز قدرات الفهم والتنبؤ بنماذج اللغة الكبيرة في مجال الجزيئات الحيوية.

يحتوي الدليل الجزيئي على 148,400 تعليمة تغطي الخصائص الأساسية وسلوكيات الجزيئات الصغيرة، وتتضمن مجموعة متنوعة من التفاعلات الكيميائية ومهام التصميم الجزيئي. تحتوي التعليمات الموجهة بالبروتين على 505000 تعليمة تغطي بنية البروتين ووظيفته والتنبؤ بالنشاط، بالإضافة إلى تصميم البروتين بناءً على تعليمات نصية. يحتوي كتاب Biomolecule Text Instructions على 53000 تعليمة، مخصصة بشكل أساسي لمهام معالجة اللغة الطبيعية في مجالات المعلوماتية الحيوية والمعلوماتية الكيميائية.

Mol-Instructions.torrent
البذر 2التنزيل 1مكتمل 41إجمالي التنزيلات 46
  • Mol-Instructions/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
        • Mol-Instructions.zip
          260.89 MB