HyperAIHyperAI

Command Palette

Search for a command to run...

MeDAL: Dataset zur medizinischen Abkürzungs-Ambiguitätsauflösung für die Vortrainierung zur natürlichen Sprachverarbeitung

Zhi Wen Xing Han Lu Siva Reddy

Zusammenfassung

Ein wesentlicher Hemmnis für die Anwendung vieler aktueller NLP-Methoden in klinischen Umgebungen ist die Verfügbarkeit öffentlicher Datensätze. In dieser Arbeit präsentieren wir MeDAL, einen großen medizinischen Textdatensatz, der speziell für die Abkürzungs-Ambiguitätsauflösung kuratiert wurde und für die Vortrainierung im Bereich der natürlichen Sprachverarbeitung im medizinischen Kontext konzipiert ist. Wir haben mehrere Modelle gängiger Architekturen auf diesem Datensatz vortrainiert und empirisch gezeigt, dass eine solche Vortrainierung zu einer verbesserten Leistung und einer schnelleren Konvergenz bei der Feinabstimmung auf nachgeschaltete medizinische Aufgaben führt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
MeDAL: Dataset zur medizinischen Abkürzungs-Ambiguitätsauflösung für die Vortrainierung zur natürlichen Sprachverarbeitung | Paper | HyperAI