Datum

vor 2 Jahren

Größe

16.04 MB

Organisation

Veröffentlichungs-URL

Paper-URL

Tags

MedCalc-Bench ist ein Datensatz, der speziell für die Bewertung der medizinischen Rechenkapazitäten großer Sprachmodelle (LLMs) entwickelt wurde. Es wurde 2024 gemeinsam von neun Institutionen veröffentlicht, darunter der National Library of Medicine, den National Institutes of Health und der University of Virginia. Die relevanten Papierergebnisse sind "MEDCALC-BENCH: Evaluierung großer Sprachmodelle für medizinische Berechnungen", wurde von NeurIPS 2024 angenommen. Dieser Datensatz enthält 10.055 Trainingsinstanzen und 1.047 Testinstanzen, die 55 verschiedene Rechenaufgaben abdecken. Jedes Beispiel enthält die Notizen des Patienten, eine Frage zur Berechnung eines bestimmten klinischen Werts, den endgültigen Antwortwert und eine schrittweise Lösung. Der Zweck von MedCalc-Bench besteht darin, die verbalen und rechnerischen Denkfähigkeiten von LLMs im medizinischen Umfeld zu verbessern. Zu den Merkmalen des Datensatzes gehören Zeilennummer, Rechner-ID, Rechnername, Kategorie, Ausgabetyp, Notiz-ID, Notiztyp, Patientennotiz, Frage, zugehörige Entität, Ground-Truth-Antwort, Untergrenze, Obergrenze und Ground-Truth-Erklärung. Diese Funktionen liefern dem Modell umfassende Kontextinformationen für genaue Berechnungen und Schlussfolgerungen. Der Datensatz ist in Trainings- und Testsätze unterteilt, die zur Feinabstimmung von LLMs verwendet werden können, um ihre Leistung bei medizinischen Computeraufgaben zu verbessern.

MedCalc-Bench.torrent

Seeding 1Wird heruntergeladen 0Abgeschlossen 213Gesamtdownloads 477

MedCalc-Bench/
- README.md
  1.94 KB
- README.txt
  3.88 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

16.04 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

vor 2 Monaten

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

vor 2 Monaten

Groundsource Global Flood Events Dataset

vor 3 Monaten

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

vor 3 Monaten

CL-bench Context Learning Evaluation Benchmark-Datensatz

vor 3 Monaten

Patientensegmentierungsdatensatz

vor 4 Monaten

Datensatz Zur Vorhersage Von Patientenabwanderung

vor 4 Monaten

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

vor 5 Monaten

TxT360-3efforts Multi-Task Inference Dataset

vor 5 Monaten

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

vor 5 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

MedCalc-Bench-Datensatz Für Medizinische Berechnungen

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MedCalc-Bench-Datensatz Für Medizinische Berechnungen

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

CL-bench Context Learning Evaluation Benchmark-Datensatz

Patientensegmentierungsdatensatz

Datensatz Zur Vorhersage Von Patientenabwanderung

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MedCalc-Bench-Datensatz Für Medizinische Berechnungen

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

CL-bench Context Learning Evaluation Benchmark-Datensatz

Patientensegmentierungsdatensatz

Datensatz Zur Vorhersage Von Patientenabwanderung

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

CL-bench Context Learning Evaluation Benchmark-Datensatz

Patientensegmentierungsdatensatz

Datensatz Zur Vorhersage Von Patientenabwanderung

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz

Zugehörige Datensätze

Sutra 10B Vortrainings- Und Trainingsdatensatz

Datensatz Zur Psychischen Gesundheit Und Zum Burnout Von Studierenden

Groundsource Global Flood Events Dataset

CHIMERA Allgemeines Inferenz-Synthetik-Datensatz

CL-bench Context Learning Evaluation Benchmark-Datensatz

Patientensegmentierungsdatensatz

Datensatz Zur Vorhersage Von Patientenabwanderung

GroundingME-Datensatz Zur Evaluierung Des Verständnisses Komplexer Szenen

TxT360-3efforts Multi-Task Inference Dataset

MCD-rPPG Multi-Kamera-Fernphotoplethysmographie-Datensatz