HyperAIHyperAI

Command Palette

Search for a command to run...

MedQA-Datensatz Zur Beantwortung Medizinischer Textfragen

Datum

vor 10 Monaten

Größe

125.64 MB

Organisation

MIT
Huazhong Universität für Wissenschaft und Technologie

Veröffentlichungs-URL

github.com

Paper-URL

arxiv.org

* Dieser Datensatz unterstützt die Online-Nutzung.Klicken Sie hier, um zu springen.

Der MedQA-Datensatz ist ein Frage-Antwort-Datensatz für den medizinischen Bereich, der den Stil der United States Medical Licensing Examination (USMLE) simuliert. Es wurde 2020 von einem Forschungsteam des MIT und der Huazhong University of Science and Technology veröffentlicht. Die zugehörigen Ergebnisse der Studie lauten:Welche Krankheit hat dieser Patient? Ein umfangreicher Open-Domain-Fragen-Antwort-Datensatz aus medizinischen Prüfungen". Der Datensatz wurde aus professionellen medizinischen Untersuchungen gesammelt und umfasst Englisch, vereinfachtes Chinesisch und traditionelles Chinesisch. Er enthält 12.723, 34.251 bzw. 14.123 Fragen und zielt darauf ab, die Fähigkeit des Modells zu bewerten, medizinisches Wissen zu verstehen und anzuwenden. .

Die Erstellung des MedQA-Datensatzes basiert auf professionellen ärztlichen Zulassungsprüfungen, wodurch die hohe Qualität und Professionalität der Fragen sichergestellt wird. Ergänzend zu den Fragedaten wurde ein umfangreiches Korpus an medizinischen Lehrbüchern erhoben und veröffentlicht, aus dem sich das Leseverständnismodell das notwendige Wissen zur Beantwortung der Fragen aneignen kann. Der Datensatz ist in Trainingssatz, Entwicklungssatz und Testsatz unterteilt, die jeweils zum Trainieren, Verifizieren und Testen des Modells verwendet werden.

Datensatzaufteilung, Fragen- und Antwortlängenstatistik
MedQA.torrent
Seeding 1Herunterladen 0Abgeschlossen 237Gesamtdownloads 871
  • MedQA/
    • README.md
      1.75 KB
    • README.txt
      3.5 KB
      • data/
        • data_clean.zip
          125.64 MB

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp