HyperAIHyperAI

Command Palette

Search for a command to run...

MedCalc-Bench-Datensatz Für Medizinische Berechnungen

Date

vor einem Jahr

Size

16.04 MB

Organization

Publish URL

github.com

Paper URL

arxiv.org

MedCalc-Bench ist ein Datensatz, der speziell für die Bewertung der medizinischen Rechenkapazitäten großer Sprachmodelle (LLMs) entwickelt wurde. Es wurde 2024 gemeinsam von neun Institutionen veröffentlicht, darunter der National Library of Medicine, den National Institutes of Health und der University of Virginia. Die relevanten Papierergebnisse sind "MEDCALC-BENCH: Evaluierung großer Sprachmodelle für medizinische Berechnungen", wurde von NeurIPS 2024 angenommen.

Dieser Datensatz enthält 10.055 Trainingsinstanzen und 1.047 Testinstanzen, die 55 verschiedene Rechenaufgaben abdecken. Jedes Beispiel enthält die Notizen des Patienten, eine Frage zur Berechnung eines bestimmten klinischen Werts, den endgültigen Antwortwert und eine schrittweise Lösung. Der Zweck von MedCalc-Bench besteht darin, die verbalen und rechnerischen Denkfähigkeiten von LLMs im medizinischen Umfeld zu verbessern.

Zu den Merkmalen des Datensatzes gehören Zeilennummer, Rechner-ID, Rechnername, Kategorie, Ausgabetyp, Notiz-ID, Notiztyp, Patientennotiz, Frage, zugehörige Entität, Ground-Truth-Antwort, Untergrenze, Obergrenze und Ground-Truth-Erklärung. Diese Funktionen liefern dem Modell umfassende Kontextinformationen für genaue Berechnungen und Schlussfolgerungen. Der Datensatz ist in Trainings- und Testsätze unterteilt, die zur Feinabstimmung von LLMs verwendet werden können, um ihre Leistung bei medizinischen Computeraufgaben zu verbessern.

MedCalc-Bench.torrent
Seeding 1Downloading 0Completed 195Total Downloads 448
  • MedCalc-Bench/
    • README.md
      1.94 KB
    • README.txt
      3.88 KB
      • data/
        • bench.zip
          16.04 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp