HyperAIHyperAI

تعليمات مول مجموعة بيانات التعليمات الجزيئية الحيوية واسعة النطاق

التاريخ

منذ 10 أشهر

الحجم

260.89 MB

المؤسسة

جامعة تشجيانغ

رابط النشر

github.com

رابط الورقة البحثية

arxiv.org

*تدعم مجموعة البيانات هذه الاستخدام عبر الإنترنت.انقر هنا للقفز.

Mol-Instructions عبارة عن مجموعة بيانات تعليمات جزيئية حيوية واسعة النطاق مصممة للنماذج اللغوية الكبيرة. تم إنشاؤه بواسطة فريق بحثي من جامعة تشجيانغ في عام 2024. نتائج الورقة ذات الصلة هي "تعليمات المول: مجموعة بيانات تعليمات جزيئية حيوية واسعة النطاق لنماذج اللغة الكبيرة"، تم قبولها من قبل ICLR 2024.

تحتوي مجموعة البيانات على ثلاثة أنواع من التعليمات: تعليمات موجهة للجزيئات، وتعليمات موجهة للبروتين، وتعليمات نصية للجزيئات الحيوية. ويهدف إلى توفير بيانات تعليمية غنية لتعزيز قدرات الفهم والتنبؤ بنماذج اللغة الكبيرة في مجال الجزيئات الحيوية.

يحتوي الدليل الجزيئي على 148,400 تعليمة تغطي الخصائص الأساسية وسلوكيات الجزيئات الصغيرة، وتتضمن مجموعة متنوعة من التفاعلات الكيميائية ومهام التصميم الجزيئي. تحتوي التعليمات الموجهة بالبروتين على 505000 تعليمة تغطي بنية البروتين ووظيفته والتنبؤ بالنشاط، بالإضافة إلى تصميم البروتين بناءً على تعليمات نصية. يحتوي كتاب Biomolecule Text Instructions على 53000 تعليمة، مخصصة بشكل أساسي لمهام معالجة اللغة الطبيعية في مجالات المعلوماتية الحيوية والمعلوماتية الكيميائية.

تعليمات مول.torrent
البذر 1التنزيل 0مكتمل 100إجمالي التنزيلات 133
  • Mol-Instructions/
    • README.md
      1.69 KB
    • README.txt
      3.39 KB
      • data/
        • Mol-Instructions.zip
          260.89 MB
تعليمات مول مجموعة بيانات التعليمات الجزيئية الحيوية واسعة النطاق | مجموعات البيانات | HyperAI