HyperAIHyperAI

Command Palette

Search for a command to run...

MedCalc-Bench-Datensatz Für Medizinische Berechnungen

Datum

vor einem Jahr

Größe

16.04 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

MedCalc-Bench ist ein Datensatz, der speziell für die Bewertung der medizinischen Rechenkapazitäten großer Sprachmodelle (LLMs) entwickelt wurde. Es wurde 2024 gemeinsam von neun Institutionen veröffentlicht, darunter der National Library of Medicine, den National Institutes of Health und der University of Virginia. Die relevanten Papierergebnisse sind "MEDCALC-BENCH: Evaluierung großer Sprachmodelle für medizinische Berechnungen", wurde von NeurIPS 2024 angenommen.

Dieser Datensatz enthält 10.055 Trainingsinstanzen und 1.047 Testinstanzen, die 55 verschiedene Rechenaufgaben abdecken. Jedes Beispiel enthält die Notizen des Patienten, eine Frage zur Berechnung eines bestimmten klinischen Werts, den endgültigen Antwortwert und eine schrittweise Lösung. Der Zweck von MedCalc-Bench besteht darin, die verbalen und rechnerischen Denkfähigkeiten von LLMs im medizinischen Umfeld zu verbessern.

Zu den Merkmalen des Datensatzes gehören Zeilennummer, Rechner-ID, Rechnername, Kategorie, Ausgabetyp, Notiz-ID, Notiztyp, Patientennotiz, Frage, zugehörige Entität, Ground-Truth-Antwort, Untergrenze, Obergrenze und Ground-Truth-Erklärung. Diese Funktionen liefern dem Modell umfassende Kontextinformationen für genaue Berechnungen und Schlussfolgerungen. Der Datensatz ist in Trainings- und Testsätze unterteilt, die zur Feinabstimmung von LLMs verwendet werden können, um ihre Leistung bei medizinischen Computeraufgaben zu verbessern.

MedCalc-Bench.torrent
Seeding 2Herunterladen 0Abgeschlossen 185Gesamtdownloads 377
  • MedCalc-Bench/
    • README.md
      1.94 KB
    • README.txt
      3.88 KB
      • data/
        • bench.zip
          16.04 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp