Datum

vor 2 Jahren

Größe

20.69 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

www.nature.com

Lizenz

CC BY-NC-SA 3.0

Tags

MMedBench ist ein umfassender mehrsprachiger Benchmark-Datensatz für medizinische Eignungstests, der 2024 vom Smart Healthcare Team der School of Artificial Intelligence der Shanghai Jiao Tong University entwickelt wurde.Auf dem Weg zum Aufbau eines mehrsprachigen Sprachmodells für die Medizin". Ziel ist es, die Entwicklung mehrsprachiger Modelle im medizinischen Bereich zu evaluieren und dabei 6 Sprachen und 21 medizinische Teilbereiche abzudecken. Alle Fragen in MMedBench werden direkt aus Fragendatenbanken für medizinische Untersuchungen in verschiedenen Ländern abgeleitet, wodurch die Genauigkeit und Zuverlässigkeit der Bewertung sichergestellt und ein diagnostischer Verständnisfehler vermieden wird, der durch Unterschiede in den Richtlinien für die medizinische Praxis in verschiedenen Ländern verursacht wird. Der Bewertungsmaßstab beinhaltet zwei Hauptbewertungsdimensionen: Auswahlgenauigkeit und Erklärungsrationalität. Während des Bewertungsprozesses muss das Modell nicht nur die richtige Antwort auswählen, sondern auch eine vernünftige Erklärung liefern, wodurch die Fähigkeit des Modells, komplexe medizinische Informationen zu verstehen und zu interpretieren, weiter getestet wird. Die Datenstatistik von MMedBench zeigt die grundlegenden numerischen Statistiken des Trainingssatzes und des Testsatzes sowie die Verteilung der Stichproben zu verschiedenen Themen. Das Forschungsteam bewertete gängige medizinische Sprachmodelle anhand des MMedBench-Benchmarks, einschließlich dreier Teststrategien: Zero-Shot, PEFT-Feinabstimmung und vollständige Modell-Feinabstimmung. Die Testergebnisse zeigen, dass das vorgeschlagene Modell bestehende Open-Source-Modelle desselben Niveaus in zwei Schlüsseldimensionen übertrifft: Auswahlgenauigkeit und Erklärungsrationalität und mit GPT-4 vergleichbar ist. Darüber hinaus führte das Forschungsteam auch eine manuelle Bewertung durch, bei der das vorgeschlagene Modell von den menschlichen Benutzern am meisten bevorzugt wurde. Die Einführung von MMedBench fördert nicht nur die mehrsprachige groß angelegte Modellforschung im medizinischen Bereich, sondern bietet auch neue Werkzeuge für die klinische Praxis und zeigt insbesondere großes Potenzial bei der Überwindung von Sprachbarrieren und der Globalisierung medizinischer Ressourcen. Alle Daten und Codes wurden als Open Source freigegeben, was die Zusammenarbeit und den Technologieaustausch innerhalb der globalen Forschungsgemeinschaft weiter fördert.

MMedBench-Datenstatistik. Abbildung a zeigt die grundlegenden numerischen Statistiken des Trainingssatzes und des Testsatzes von MMedBench. Abbildung b zeigt die Verteilung der MMedBench-Stichproben zu verschiedenen Themen.

MMedBench.torrent

Seeding 3Wird heruntergeladen 0Abgeschlossen 177Gesamtdownloads 435

MMedBench/
- README.md
  2.67 KB
- README.txt
  5.33 KB

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden

Auf Discord diskutieren

Datum

vor 2 Jahren

Größe

20.69 MB

Organisation

Veröffentlichungs-URL

github.com

Paper-URL

www.nature.com

Lizenz

CC BY-NC-SA 3.0

Zugehörige Datensätze

CL-bench Context Learning Evaluation Benchmark-Datensatz

vor 3 Monaten

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

vor 4 Monaten

Datensatz Zur Vorhersage Von Patientenabwanderung

vor 4 Monaten

LongBench-Pro Long Context Comprehensive Evaluation Dataset

vor 5 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

MMedBench Benchmark-Datensatz Für Mehrsprachige Medizinische Eignungstests

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MMedBench Benchmark-Datensatz Für Mehrsprachige Medizinische Eignungstests

Zugehörige Datensätze

CL-bench Context Learning Evaluation Benchmark-Datensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Datensatz Zur Vorhersage Von Patientenabwanderung

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

MMedBench Benchmark-Datensatz Für Mehrsprachige Medizinische Eignungstests

Zugehörige Datensätze

CL-bench Context Learning Evaluation Benchmark-Datensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Datensatz Zur Vorhersage Von Patientenabwanderung

LongBench-Pro Long Context Comprehensive Evaluation Dataset

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

CL-bench Context Learning Evaluation Benchmark-Datensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Datensatz Zur Vorhersage Von Patientenabwanderung

LongBench-Pro Long Context Comprehensive Evaluation Dataset

Zugehörige Datensätze

CL-bench Context Learning Evaluation Benchmark-Datensatz

LightOnOCR-mix-0126 Texttranskriptionsdatensatz

Datensatz Zur Vorhersage Von Patientenabwanderung

LongBench-Pro Long Context Comprehensive Evaluation Dataset