HyperAIHyperAI

Command Palette

Search for a command to run...

مجموعة بيانات معيارية لعلم الأحياء لنموذج لغة مختبر LAB

التاريخ

منذ عام واحد

الحجم

241.96 MB

المؤسسة

فيوتشر هاوس

رابط الورقة البحثية

arxiv.org

* هذه المجموعة من البيانات تدعم الاستخدام عبر الإنترنت.انقر هنا للقفز.

هناك تفاؤل واسع النطاق بأن نماذج اللغة الكبيرة المتطورة (LLMs) والأنظمة المعززة بـ LLM لديها القدرة على تسريع الاكتشاف العلمي بسرعة عبر مجموعة واسعة من التخصصات. توجد اليوم العديد من المعايير التي تقيس المعرفة والقدرة على التفكير لدى طلاب الماجستير في القانون فيما يتعلق بالمشكلات العلمية الموجودة في الكتب المدرسية، ولكن يتم استخدام عدد قليل من المعايير لتقييم أداء نماذج اللغة في المهام العملية المطلوبة للبحث العلمي، مثل استرجاع الأدبيات، وتخطيط البروتوكول، وتحليل البيانات.

كخطوة أولى في إرساء مثل هذا المعيار، أطلق فريق البحث من FutureHouse معيار بيولوجيا وكيل اللغة (LAB-Bench) في عام 2024. تحتوي مجموعة البيانات هذه على أكثر من 2400 سؤال متعدد الاختيارات لتقييم أداء أنظمة الذكاء الاصطناعي في سلسلة من قدرات البحث البيولوجي العملي، بما في ذلك استرجاع الأدبيات وقدرات الاستدلال، وقدرات تفسير البيانات، والقدرة على الوصول إلى قواعد البيانات والتنقل فيها، والقدرة على فهم تسلسلات الحمض النووي والبروتين والتحكم فيها، وما إلى ذلك. نتائج الورقة ذات الصلة هيLAB-Bench: قياس قدرات نماذج اللغة في أبحاث علم الأحياء"

LAB-Bench.torrent
البذر 1التنزيل 0مكتمل 165إجمالي التنزيلات 329
  • LAB-Bench/
    • README.md
      1.65 KB
    • README.txt
      3.3 KB
      • data/
        • lab-bench.zip
          241.96 MB

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة المشتركة بالذكاء الاصطناعي
وحدات معالجة رسومات جاهزة
أفضل الأسعار
ابدأ الآن

Hyper Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
مجموعة بيانات معيارية لعلم الأحياء لنموذج لغة مختبر LAB | مجموعات البيانات | HyperAI