HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات الإجابة على أسئلة نص بروتين ProtT3

التاريخ

منذ عام واحد

الحجم

1.4 GB

المؤسسة

جامعة هوكايدو
الجامعة الوطنية في سنغافورة
جامعة العلوم والتكنولوجيا في الصين

رابط النشر

github.com

رابط الورقة البحثية

arxiv.org

تم إنشاء مجموعة بيانات ProtT3 بشكل مشترك من قبل فرق بحثية من الجامعة الوطنية في سنغافورة، وجامعة العلوم والتكنولوجيا في الصين، وجامعة هوكايدو في عام 2024.ProtT3: توليد البروتين إلى نص لفهم البروتين القائم على النص"وقد تم اختيارها لـ ACL 2024. هذه المجموعة من البيانات هي مجموعة بيانات ما قبل التدريب للبحث الورقي.

تتكون مجموعة بيانات ProtT3 من ثلاث مجموعات بيانات: Swiss-Prot وProteinKG25 وPDB-QA.

إحصائيات مجموعة بيانات نص البروتين

كما هو موضح في الجدول أعلاه، Swiss-Prot هي قاعدة بيانات تسلسل البروتين مع تعليقات نصية. قام الباحثون بمعالجة مجموعة البيانات واستبعدوا أسماء البروتينات من التعليقات النصية لمنع تسرب المعلومات. يربط وصف النص الناتج بين التعليقات التوضيحية لوظيفة البروتين وموقعه وعائلته.

ProteinKG25 هو رسم بياني للمعرفة مشتق من قاعدة بيانات GeneOntology. قام الباحثون في البداية بتجميع ثلاثيات من نفس البروتين ثم قاموا بملء معلومات البروتين في قالب نصي محدد مسبقًا لتحويل ثلاثياته إلى نص حر.

PDB-QA عبارة عن مجموعة بيانات للإجابة على أسئلة البروتين ذات الدورة الواحدة والمشتقة من RCSB PDB2. يحتوي على 30 قالبًا للأسئلة حول بنية البروتين وخصائصه ومعلومات تكميلية. وكما هو موضح في الجدول أدناه، من أجل التقييم الدقيق، قام الباحثون بتقسيم الأسئلة إلى أربع فئات بناءً على شكل الإجابة (سلسلة أو رقم) والتركيز على المحتوى (الهيكل / السمة أو المعلومات التكميلية).

أزواج عينات ضمان الجودة في مجموعة بيانات PDB-QA
ProtT3.torrent
البذر 1التنزيل 0مكتمل 191إجمالي التنزيلات 274
  • ProtT3/
    • README.md
      2.13 KB
    • README.txt
      4.26 KB
      • data/
        • osfstorage-archive.zip
          1.4 GB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp